守備の難易度の性質
前回は新年の抱負に代えて、今年は守備能力のコアな部分を評価したいという目標を掲げました。
コアな部分というのは、私たちが目にする守備指標は、野手の守備能力に加え、ノイズとなる要素も含まれているためで、こうした要素を除きながら守備の評価をできないかと考えているわけです。
ノイズとなりうるもの
何がノイズになるかというと、守備の成否が能力ではなく運によって左右されるような打球と考えます。では、どのようなプレーが運に左右されるのでしょうか?
MLBで用いられている守備のスタッツであるOAAでは、野手からボールまでの距離と時間からアウトを取る難易度を求めます。そして処理した打球の難易度ごとに守備機会を集計しています。具体的には以下の5つの☆によって分類されています。
☆☆☆☆☆(0-25%)
☆☆☆☆(26-50%)
☆☆☆(51-75%)
☆☆(76-90%)
☆(91-95%)
今回の目的は、この☆ごとの難易度の守備機会とアウト率の性質を確認したいと思います。これらの性質が見えてくれば、運に左右されやすいプレーというものが見えてくるのではないかと思います。
難易度の内訳
最初に確認するのは、MLB各シーズンでの難易度の内訳の推移です。https://baseballsavant.mlb.comより難易度のデータをダウンロードして、シーズンごとに集計したものを以下の図1に示します。
シーズンによる内訳に大きな変化はありません。それぞれ20%程度の内訳となっており、四つ星(☆☆☆☆)と三ツ星(☆☆☆)の割合は他より少なくなっています。
守備機会の分布
次に確認するのは、守備機会の分布です。図1のデータは全選手のデータを合計した内訳ですが、ここからは中堅手(CF)の選手のみを分析の対象とします。
以下の図には、選手個人のデータを難易度ごとに守備機会の数をカウントしたものと、その守備機会が全体に占める割合をプロットしています。
右に行くほど守備機会の数が多く、上に行くほど内訳の割合が高くなります。
守備機会が多くなるほど内訳の割合も高くはなりますが、それが全体の50%を超えるようなことはなく、図1で見た難易度ごとの割合に±5%から10%の範囲に分布しています。
次に、各難易度の割合とそこでのアウト率の関係も以下の図に示します。
右に行くほど内訳の割合が高く、上に行くほどアウト率が高くなります。
守備機会が多く内訳の割合が高くなっても、それがアウト率に影響するような関係ではありませんでした。
難易度によってアウト率の分布の幅に差があり、四つ星(☆☆☆☆)と三ツ星(☆☆☆)の割合は他より幅広くなっています。
シーズンを挟んだ変化
続いて、難易度ごとに守備機会の内訳の割合の年度間相関を求めます。年度間相関とは、シーズンごとの成績の相関係数を求めたもので、相関関係が弱い、もしくは認められない場合、そのスタッツは選手の能力よりも運に左右されやすいということがわかります。分析の結果を以下の図に示します。
全ての難易度で相関は無いといってよい結果です。前年の守備機会の多寡は翌年には反映されないということがわかります。
この年度間相関の翌年のデータの部分を、翌年から前年の値を引いたもの(翌年-前年)に替えて相関係数を求めた結果を以下の図に示します。
全体として、中程度の負の相関関係を確認できます。一つ星(☆)は強い負の相関関係と言って良い結果です。これは、前年の守備機会が多いほど翌年は守備機会が少なくなること、前年の守備機会が少なければ翌年は多くなる関係を表しています。BABIPでも見られるこの傾向は平均回帰傾向と呼ばれます。
年度間相関が認められず平均回帰傾向が認められることから、守備機会の多寡は運に左右されるところが大きい、つまりは野手にはコントロールできない要素であるといえます。当たり前の話ですが、数値として確認することができました。
続いて、難易度ごとのアウト率でも年度間相関を求めたものを以下の図に示します。
五つ星(☆☆☆☆☆)から三ツ星(☆☆☆)までは中程度の正の相関関係が認められ、二つ星(☆☆☆)では弱い正の相関、一つ星では(☆)相関は認められませんでした。
アウト率でも平均回帰傾向を確認したものを以下の図に示します。
こちらは守備機会とほぼ同等の平均回帰傾向を確認できました。
アウト率の五つ星(☆☆☆☆☆)から三ツ星(☆☆☆)までは年度間相関が確認できましたが、他では相関が無く、平均回帰傾向が認められたことから、運による影響が確認できます。
まとめ
以上の分析より、☆で表される難易度ごとの性質を確認できました。守備機会は運に左右されるところが大きいようで、アウト率も難易度の低いプレーは運に左右されやすい傾向が認められています。
基礎集計なのでそんなに面白い物でもないですが、必要な人は参照してください。
今回は一般的な傾向を確認したので、次回は今回分析した難易度ごとの守備成績の変化と、守備指標の関係を分析しようと思います。
タイトル画像:いらすとや
使用データ