![見出し画像](https://assets.st-note.com/production/uploads/images/32470651/rectangle_large_type_2_de85563c9062a985864a7b5c40f24e7a.png?width=1200)
StatcastデータとBABIP
2つのwOBA
Statcastデータには、2つのwOBAの値があります。1つは、打席の結果(安打やアウトなど)に対して決まった値を割り当てているwoba_valueという値です。
もう1つは、estimated_woba_using_speedangleという値で、こちらは打球の角度と速度から、これに相当する結果として推定されたwOBAの値を割り当てています。この2つの値は一致するわけではなく、結果に対して推定値が高かったり、低かったりします。
ところで、シーズン中に当たりは良いのに結果の出ていない打者を見ることは珍しくないと思います。この当たりの良さのをestimated_woba_using_speedangleで、結果をwoba_valueという2つの値と見て、当たりと結果が不釣り合いな打者を、2つのwOBA値の差として評価できないだろうか?と考えています。
BABIPの性質
前回の分析では、この2つのwOBAの差の値の性質を分析しましたが、シーズンを挟んだ値の関係を分析したところ、BABIPとよく似た性質が確認できました。
2つのwOBAの差が極端に大きい、もしくは小さい場合に平均レベルに回帰するという性質です。BABIPはこの性質から、あるシーズンで高すぎる場合(平均は.300程度)、翌年の成績が低下するという傾向を見ることができます。
例えば、MLBの2017年から2019年において、2年連続100打数以上の記録のある打者を対象に、前年のBABIPと、翌年のOPSから前年のOPSを引いた値の関係を以下の図1に示します。
※データはhttp://www.seanlahman.com/baseball-archive/statistics/を参照
前年のBABIPが高いと、翌年のOPSは前年よりも低下していることを確認できます。この関係から、BABIPの値を見れば翌年の成績をある程度予測できることになります。
しかし、相関係数が示すように、この関係は強固というほどではありません。BABIPと似た性質を2つのwOBAの差から確認しましたが、図1のBABIPの部分に2つのwOBAの差を置き換えた場合、BABIPの代替、もしくはBABIP以上の精度で翌年の成績を予測することができたりしないでしょうか?
2つのwOBAの差と成績の変化
というわけで、上記のデータに前回の2つのwOBAの差を追加し、BABIPの代わりに用いて分析した結果を以下の図2に示します。
分析の結果、相関関係があるとはいえません。平均への回帰傾向はBABIPと似ていますが、翌年の成績の予測には使えなさそうです。
図2のデータは全打球の2つのwOBAの差を合計したものです。もしかすると、打球によっては翌年の成績との関係が異なる可能性もあるので、打球ごとに分析したものを以下の図3-1から図3-4に示します。
こちらも相関があるとはいえない結果です。
まとめ
以上、2つのwOBAの差が翌年の成績を予測する要因となるかを分析したわけですが、どうもそうはいかないというのが今回の結果です。BABIPと似たような傾向だったので、使えるかなとも思ったのですが……。
単純な将来の予測因子ではないということがわかりましたので、この2つのwOBAの性質についてはもう少し丁寧に見ていこうかと思います。
タイトル画像:いらすとや