![見出し画像](https://assets.st-note.com/production/uploads/images/67274927/rectangle_large_type_2_e49ebba3532be827b94d54e8f38b8053.png?width=1200)
HRと球場
今回はBaseball Savantより1つデータを紹介したいと思います。それが以下のリンクになります。
これは、Leaderboardにあるホームランのデータです。飛球を以下の3種に分類したデータが掲載されています。
・No Doubters: Out at All 30 Stadiums,
・Mostly Gone: Out at 8 to 29 Stadiums,
・Doubters: Out at 7 Stadiums or Fewer
“No Doubters”はMLB30球団全ての球場でHRとなる打球の意で、文句なしのHRとでも呼ぶことができるでしょうか。“Mostly Gone”は8~29のほとんどの球場でHRとなる打球、最後の“Doubters”は限られた球場でしかHRにならない打球を意味します。
このデータ、HRとなった打球を分類したものかと思ったのですが、3つを合計してもHR数と合わなかったり、HRが0の打者であってもDoubtersの記録のある打者がいるので、これは飛球をカウントしたものだと判断します。
強打者は“No Doubters”が多いのか?
さて、これらのデータを見ると、当然HRの多い強打者ほど文句なしの“No Doubters”の本数が多いと率直には考えられますが、実際のところどうでしょうか?データを集計してみたいと思います。
その前に、このデータは2019年以降の記録があるのですが、2020年と2021年の最大値が5と3であるのに対し、2019年は最大が30で、10を超える打者も100人います。2019年は文句なしの一発がこの2年よりも多数飛び交っていたと考えるよりは、集計方法が変わったと見るのが妥当かと思いますので、今回は2020年と2021年のデータを見ていきます。
ご存じのように、2020年は新型コロナの影響で短縮シーズンでしたので、2020年と2021年は別々に集計し、“No Doubters”の数とHRの数を比較してみました。以下の表1に示します。
表では縦にHRの数で打者を分類、横は“No Doubters”の数で打者を分類し、該当する打者の人数を集計しています。
2021年のデータを見ると、確かにHRが5本未満(0~5)と30本以上(30~)を比べれば、30本以上の打者のほうが“No Doubters”の数が多いわけですが、それでも半数以上は“No Doubters”は0本もしくは1本というデータです。
このデータより、“No Doubters”はそこまで頻繁に起こるような出来事ではないと見たほうが良いかもしれません。
“Mostly Gone”と”Doubters”はどうか?
同様の集計を“Mostly Gone”と”Doubters”でもやってみました。結果を以下の表2と表3に示します。
こちらはHR数と相関がありそうです。散布図でも関係を確認したものを以下の図1と図2に示します。
図1の“Mostly Gone”が多いほどHRも多いことが確認できます。図2の”Doubters”ではこの傾向が弱くなります。
この3つのデータ間の相関を求めた結果を以下の表4に示します。
2021年のほうが2020年よりも相関係数が高いのは、2020年の試合が少ないことが原因と考えられます。データ間の関係は共通で、“Mostly Gone”と”Doubters”間では正の相関関係が認められますが、“No Doubters”と他2つの相関はごく弱い関係しか認められていません。
まとめ:もっといろいろやりたいのだけれど……
以上のデータより、HRを量産する強打者は、球場によってHRにならない場合もありますが、“Mostly Gone”と”Doubters”の打球を多く打つ打者といえそうです。文句なしの“No Doubters”はそこまで量産できるものではないともいえそうです。
今回の分析、当初は以前分析したHR/FBとバレルとの関係のデータに紐付けて分析する予定でした。
しかし、Baseball Savantのリンクを見てほしいのですが、今回のデータレギュラーシーズンの成績に、ポストシーズンの成績を加えたものなのです。
データを紐付けるにはポストシーズンのデータ、打席数とフライ(FB)の数だけでも良いので、どこかで利用できる所はないでしょうか?
ここがクリアできれば、例えばBarrel%が高いのにHR/FBはそれほど高くない、そうした打者の“Mostly Gone”と”Doubters”は?翌年はどのような成績になる?といった検証ができるようになるかと思います。
とりあえず今後の課題ということで。
タイトル画像:いらすとや