![見出し画像](https://assets.st-note.com/production/uploads/images/8564956/rectangle_large_type_2_efedab8258a5063988e0c3e1bffc0be1.jpg?width=1200)
ビッグデータを使って、プロ野球選手の成績を予測したい
このnoteは、『誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性』という本を読んだ感想です。
第1回:「ビッグデータ」って、なんで注目されてるの?
第2回:100年前の卒業アルバムの写真が、真顔な理由
第3回:インターネットは、本当に人々を分断したのだろうか?
第4回:ひとはいつ、政治的価値観を形成するの?
第5回:暴力的な映画は、犯罪を誘発するのか?
今回のテーマは「野球×データ」です。
「野球」と「データ」の深い関わり
ぼくは高校まで野球をやっていて、一応名ばかりの高校球児でした。
この連載ではビッグデータを活用した面白い事例を紹介していますが、「野球×データ」の組み合わせは、少しでも野球に興味があるひとなら、比較的馴染みの深いものですよね。
打者は打席に立つたびに、自分の打率や本塁打数といった成績がスコアボードにデカデカと表示されます。
年俸だってほぼ丸裸にされて、対戦相手について研究するときも、膨大な量のデータを使います。
少し前に『マネーボール』という作品が、話題になったことを覚えているひとも多いでしょう。
それくらい、「野球」と「データ」の関係は深いものなのです。
ビッグデータで選手の成績を予測したい
データは野球の様々な場面で活用されていますが、本のなかで紹介されていた事例は、「データを使ってその選手が来年はどれくらい活躍できるのかを予測したい」というものでした。
もしあなたが野球チームの監督なら、喉から手が出るほどほしいそんな予測モデルを、2003年にとある統計学者が提唱しました。
ネイト・シルバーさんです。
アメリカの選挙結果をズバズバ当てるので有名な人ですね。
実は彼、野球のデータ分析の専門家でもあったんです。
彼の提唱したモデルの根幹は、「分身」を見つけることでした。どういうことか。
まず、これまでに登録されたメジャー選手18,000人をデータベース化します。
そこに、それぞれの選手についてわかっているあらゆるデータを注ぎ込みます。
身長、年齢、守備位置、ホームラン数、打率、四球率、三振率などを、現役時代の全年度にわたって記録します。
成績を予測したい選手に、よく似た戦績の選手20名を選出するためです。
そして彼ら(分身)の、成績を分析します。
そうすることによって、予測したい選手のこの年齢のシーズンは、このくらいの成績になるであろう、という結果を導き出すのです。
でもこの方法って、もうすでにいろんな分野で使われてるよね?
おーすげー!と思ってくれた方、ありがとうございます。
でも、こう思った方もいたかもしれません。
「え、このやり方って、けっこう他の分野でもやってるんじゃない?」
そうです。
実はこの方法、「分身検索法」などと言えば、なんとなく聞こえはいいですが、いろんなサービスで活用されている「レコメンド」と、仕組み自体はなんら変わりありません。
同じようなひとがどんな商品を買ったのか?アマゾンですね。同じようなひとがどんな映画を見たのか?ネットフリックスですね。
そうです、だから逆にいえばこの「分身検索法(またの名をレコメンド)」が、ビッグデータ活用の重要なイチ手段なのです。
今後「分身検索法」が期待される分野
「なんだ、結局レコメンドがビッグデータの活用方法なのね」が、このnoteで書きたかったことではありません。
実はまだまだ、分身検索法が活用されきっていない分野がたくさんあります。
本中で挙げられている分野のひとつが、「医療」です。
AIを使った画像診断なんかは最近よく聞きますが、それだけじゃなく、もっと細かい情報も共有したデータベースを構築することによって、患者への診断結果や治療公開がアップするのではないでしょか。
人間の直感とは、結局、個人のなかにある極少量のデータから導き出された、「分身検索法」の前身に過ぎません。
それぞれの知見を持ち合わせて巨大なデータにすることによって、いまよりもっと確度の高い「分身検索法」が行えるようになるのです。
★こっちは「野球」×「note」
いいなと思ったら応援しよう!
![藤本 健太郎](https://assets.st-note.com/production/uploads/images/108866428/profile_a283a47aa34eb0ba7b92b3d05bb04915.jpg?width=600&crop=1:1,smart)