はじめに
ごあいさつ
今日からnoteなるものを書き始めようかと思います。
自己紹介になるかはわかりませんが、普段は株式会社DELTAというところに野球のデータを分析したものを寄稿しています。リンクはその一例です。
そして、上のリンク先のDELTAに、MLBのStatcastデータ(詳しくは後述)を分析した記事を書こうと思い準備をしていたのですが、利用規約を確認したところ、“個人の非営利的な家庭での使用”に用途が限られているではありませんか。
これでは寄稿する分には使えない……ということで、このnoteを使ってマガジン形式でデータを分析したものを紹介していこうかと考えた次第です。
マガジンタイトルの「野球いじり」は、サービスが停止してしまいましたが、以前スポーツナビで書いていたブログタイトルを引っ張り出してきました。この看板の下で、時々データを分析した結果を紹介していけたらと思います。
Statcastとは
ところで、スタットキャスト(Statcast)とは、アメリカのメジャーリーグベースボール(MLB)で導入されているデータ解析ツールで、カメラやレーダーを使用して選手やボールの動きを分析するためのシステムです。
このNHKの番組でも紹介されていましたが、打球の角度や速度が数値化されることで、ホームランの生まれやすい速度と角度をバレルという指標で表すことができるようになったという形で活用されています。こうした情報がスタットキャストから得られるデータになります。
予備知識としての全体像が知りたい
今までにない角度から野球を照らすスタットキャストによるデータですが、個人的に気になることがあります。見出しにもあるように、予備知識としてのデータの全体像が見えないことです。
例えば、大谷翔平選手が出場した試合のニュースでは、彼の打った打球の速度を伝えてくれるものがあります。彼の打った打球の速度はこれくらいで、MLBの中でどれくらい凄い打球だといった感じです。
1つのプレーに関わる情報が豊かになることは大歓迎です。しかし、
MLB全体の打球の角度や速度はどうなっているの?
強打者はどれくらいの割合で速い打球を打っているの?
というスタットキャストデータの全体像が示されていません。打者の評価には、こののような情報が予備知識として必要になります。例えば、打率のような、その成績の傾向が経験的に良く知られている指標であれば、それほど重要なことではありません。しかし、スタットキャストは、ごく最近測定が始まったばかりの指標なので、こうした予備知識を把握しておくことは大切ではないかと思います。
ただ、こうした情報を日々のニュースの中で丁寧に説明しているほど紙面に余裕は無いはずです。だったらこのネットの片隅にデータを残しておこうというのが、ここの大きな目的となります。
こうした情報の蓄積は、MLBの理解だけではなく、いずれ日本のプロ野球でも役に立つのではないかと期待しています。
技術的なこと
スタットキャストデータのスクレイピングには、以下のリンクのTsuyupon氏のstatcastrパッケージを用いました。
統計ソフトRを用いてこのパッケージを扱います。データの分析にはRと必要に応じてエクセルを用います。Rの操作方法等についてはいろいろとソースがありますが、野球のデータ分析については、以下の書籍がお勧めです。
それでは、初回は挨拶ということでこんなもので。割と見切り発車ですが、興味のある方はお付き合い頂けたらと思います。