[コラム]データを読み解く力について
最近は朝仕事に入る前にコラムをちょこっと書くのが楽しいな、と思っているので、今日も軽く入ってみようと思います。
私サッカーはあまり見ないのですが、レオザさんの切り抜きを見るのは結構好きで、以下のような内容が回ってきました。
これはサッカーだけではなく、競馬でも流用できるお話しです。
データは数字で立証されているから正しい!と考えがちですが、実はそういう話でもなく、数字の裏にある現象を正しく読み解かないといけない、ということが大事です。
一例をあげましょう。
中山D1800で(1.0.0.4)という馬がいました。今回も中山D1800に出走です。
データ上は20%しか勝率はありません。では、好走確率は薄い、という結論を出して良いものでしょうか。
これは絶対に間違いと言える内容で、この5戦の中身を見ることが大事です。
数字の中で語るのであれば、この負けた4戦の内容と勝った1戦の内容を確認することが大事になりますね。
負けた4戦は1年以上前のレースで3歳時のレベルの高い未勝利戦や3最世代戦での敗戦。勝ったのは最近でレースの内容が優秀。
という仮に結果が出れば、これはこのデータそのものの内容を疑わないといけないですし、数字の裏付けではなく、その馬が
「コーナーリング性能がどうなのか」、「登坂できるパワーがあるのか」、「右回りで手前が変えられるのか」などそもそも馬のキャラクターがどういうキャラなのか、レースに行った時に「スムーズな競馬ができるのか(器用なキャラなのか)」などももちろん考えるべき内容です。
そもそも、統計を持ち出すには競馬は過去10年のデータを引っ張り出してきても、絶対的に分母の数が足りないですし、全く意味がないと思っています。
また、馬場の状況、競馬における概況なども年単位で大きく変わってくるので、押し並べてデータをとっても意味のないことが多いです。
そのため、出てきているデータの裏に何があるのか、を仮説としてもち、その仮説を検証して利用できるものかを考え、実践に活かしていくことが大事になります。
今のSNSはそれっぽく正しそうなデータがいっぱい溢れています。
データを読み解く力のない人間がそのまま掲載することも多く、役に立ったつもりになっていることが多いです。
そもそも、仮説のないわかりやすいデータは過剰な人気をうみ出し、当たった時に思っている以上にリターンの少ない馬券になりがちです。
データを見る上で必要なのはデータを読み解く力、その上で、他の人が持っていない仮説をいかにうまく利用できるか、が大事になります。
現在は切り抜き文化で、現代人は時間もなく、ニュースもヘッドラインしか読まない、などになりがちです。
日常生活においてのニュースは良いですが、こと競馬においてはこれはマイナス(過剰人気をつかまされる可能性もある)なので、しっかり考える、考える時間がないのであれば、ちゃんと考えている(ここを判断するのもまた難しいものですが)人間の話しを聞き、自分で咀嚼しましょう、というお話しでした。
では、今日はこの辺で。
✅12月のコミュニティ会員募集中です!