続・HRと球場
昨年の分析になりますが、Baseball SavantよりHRに関するデータを紹介しました。
これは、Leaderboardにあるホームランのデータです。飛球を以下の3種に分類したデータが掲載されています。
・No Doubters: Out at All 30 Stadiums,
・Mostly Gone: Out at 8 to 29 Stadiums
・Doubters: Out at 7 Stadiums or Fewer
“No Doubters”はMLB30球団全ての球場でHRとなる打球の意で、文句なしのHRとでも呼ぶことができるでしょうか。“Mostly Gone”は8~29のほとんどの球場でHRとなる打球、最後の“Doubters”は限られた球場でしかHRにならない打球を意味します。
データの修正と追加
今回は以前の分析にデータを追加して分析しようと思っていたのですが、上記のデータ元を確認したところ、以前の分析をしていた時とは数値が異なっていました。以前のデータでは2020年と2021 は多い打者でもNo Doubtersは数本だったのですが、現在は20本を超える打者も少なくありません。
正直何が起こったのかよくわからないのですが、何分新しいデータですので、こういうこともあるだろうということで、今回はこの変更後のデータを使って、以前の分析をやり直そうかと思います。
さらに、以前のデータに加え、レギュラーシーズンに加えて、プレーオフの打席数とフライ数のデータを入手方法を教えてもらったので、今回はフライに対するNo Doubters・Mostly Gone・Doubtersの割合を用いたいと思います。
データの分布
最初に、フライあたりのデータの分布を確認します。以下の表1にデータを示します。
確認用にシーズンごとの分布をグラフ化したものを以下の図1-1から図1-4に示します。
データは2019年から2021年までのものを用いています。分布はまぁこういうものかということで、データ間の相関を以下の表2に示します。
HR/FBとNo Doubters/FBとMostly Gone/FBとの間に正の相関関係が認められていますが、他で相関関係は認められていません。
シーズン間の成績の安定性
次に、各スタッツのシーズン間の安定性を見るために、2シーズン連続で100打席以上の記録のある打者のシーズン間の値の相関をもとめました。まずは、HR/FBとDoubters/FBのデータを以下の図2-1と図2-2に示します。
HR/FBには正の相関関係が認められましたが、Doubters/FBは無相関と言って良い結果です。
続いて、Mostly Gone/FBとNo Doubters/FBのデータを以下の図2-3と図2-4に示します。
これらも無相関、もしくはNo Doubters/FBは弱い正の相関関係といえる結果です。
シーズン間の成績の変化
次は、同様のデータから前年の値と、翌年から前年の値を引いた値との関係について、HR/FBとDoubters/FBのデータを以下の図3-1と図3-2に示します。
こちらは負の相関関係が認められました。ということは、前年の値が高いほど翌年は前年よりも低い値に、逆に前年の値が低いと、翌年は前年よりも高くなるという関係です。これはBABIPというスタッツでも見られる現象ですが、打者の能力ではコントロールが難しいスキル、つまりは運によって左右されやすいスタッツではこのような傾向がみられます。
Mostly Gone/FBとNo Doubters/FBのデータを以下の図3-3と図3-4に示します。
こちらも負の相関関係を確認できます。
まとめ
データを一新しての分析でしたが、フライに対するNo Doubters・Mostly Gone・Doubtersの割合は、それぞれ相関関係は認められませんでした。またシーズン間の値に相関は認められず、図3で確認したように、前年の値が高ければ翌年は低下、前年が低ければ翌年は高くなるという関係を確認しました。これらの特徴は、運の影響を強く受けやすいことを示しています。
この辺りの性質は次回も掘り下げて分析したいと思います。
タイトル画像:いらすとや