見出し画像

[コラム]データを読み解く力について

最近は朝仕事に入る前にコラムをちょこっと書くのが楽しいな、と思っているので、今日も軽く入ってみようと思います。

私サッカーはあまり見ないのですが、レオザさんの切り抜きを見るのは結構好きで、以下のような内容が回ってきました。


これはサッカーだけではなく、競馬でも流用できるお話しです。
データは数字で立証されているから正しい!と考えがちですが、実はそういう話でもなく、数字の裏にある現象を正しく読み解かないといけない、ということが大事です。

一例をあげましょう。

中山D1800で(1.0.0.4)という馬がいました。今回も中山D1800に出走です。
データ上は20%しか勝率はありません。では、好走確率は薄い、という結論を出して良いものでしょうか。

これは絶対に間違いと言える内容で、この5戦の中身を見ることが大事です。
数字の中で語るのであれば、この負けた4戦の内容と勝った1戦の内容を確認することが大事になりますね。

負けた4戦は1年以上前のレースで3歳時のレベルの高い未勝利戦や3最世代戦での敗戦。勝ったのは最近でレースの内容が優秀。
という仮に結果が出れば、これはこのデータそのものの内容を疑わないといけないですし、数字の裏付けではなく、その馬が
「コーナーリング性能がどうなのか」、「登坂できるパワーがあるのか」、「右回りで手前が変えられるのか」などそもそも馬のキャラクターがどういうキャラなのか、レースに行った時に「スムーズな競馬ができるのか(器用なキャラなのか)」などももちろん考えるべき内容です。

そもそも、統計を持ち出すには競馬は過去10年のデータを引っ張り出してきても、絶対的に分母の数が足りないですし、全く意味がないと思っています。
また、馬場の状況、競馬における概況なども年単位で大きく変わってくるので、押し並べてデータをとっても意味のないことが多いです。

そのため、出てきているデータの裏に何があるのか、を仮説としてもち、その仮説を検証して利用できるものかを考え、実践に活かしていくことが大事になります。

今のSNSはそれっぽく正しそうなデータがいっぱい溢れています。
データを読み解く力のない人間がそのまま掲載することも多く、役に立ったつもりになっていることが多いです。

そもそも、仮説のないわかりやすいデータは過剰な人気をうみ出し、当たった時に思っている以上にリターンの少ない馬券になりがちです。

データを見る上で必要なのはデータを読み解く力、その上で、他の人が持っていない仮説をいかにうまく利用できるか、が大事になります。

現在は切り抜き文化で、現代人は時間もなく、ニュースもヘッドラインしか読まない、などになりがちです。

日常生活においてのニュースは良いですが、こと競馬においてはこれはマイナス(過剰人気をつかまされる可能性もある)なので、しっかり考える、考える時間がないのであれば、ちゃんと考えている(ここを判断するのもまた難しいものですが)人間の話しを聞き、自分で咀嚼しましょう、というお話しでした。

では、今日はこの辺で。

✅12月のコミュニティ会員募集中です!

https://docs.google.com/forms/d/e/1FAIpQLSdFrpAHE-yeeEZvCkiD8BDPsXljKiBtYXgaaz-w-L5eUCkazg/viewform?usp=sf_link


いいなと思ったら応援しよう!

ローエングリン
いつもありがとうございます!