新年の抱負に代えて
あけましておめでとうございます。
今年もぼちぼち分析を進めていこうかと思います。
さて、新年一発目なので今年の抱負に代えて、分析の目標など掲げてみたいと思います。といっても、昨日今日思いついたわけではなく少しずつ進めて来たものです。
というわけで、目標というか方針ですが、以下に掲げます。
『守備力のコアな部分を評価したい』
というものになります。
コアってなんだ?
これだけではわからないと思うので、少し説明しておこうかと思います。これまで取り上げられてきた守備力を評価するスタッツ、OAAやUZRでは、野手の守備の能力に加え以下の図1に示すような、能力以外のノイズ(誤差)も混ざった形で数値化されています。
このノイズの部分がプラスに偏れば、実際の守備の能力よりもスタッツは高得点になります。逆にノイズがマイナスに偏ればスタッツの値は低くなります。
ノイズを取り除くには
過大評価や過小評価をすることなく守備の能力を見たいというのは誰しも考えるところで、そのために様々なスタッツが日々開発され研鑽されているわけです。
このノイズを除くオーソドックスな方法としては、データのサンプルを増やすというものがあります。サンプル数が増えれば、ノイズはプラスとマイナスが相殺され、0にはなりませんが偏りは小さくなります。
古くから規定打席や規定投球回数があるように、サンプルを増やす必要性というのは理解されてきているわけですが、その一方で、デビュー間もない若手の選手や、来日直後の外国人選手の評価が難しくなります。
というわけで、サンプル増に頼らない評価方法を編み出したいと考えるわけです。
何がノイズとなるか?
サンプル増に頼らない方法とは何かを考えるに、サンプルを厳選するという方法になると思います。1つ1つのプレーとその結果に対し、ノイズかどうかを判定し、ノイズではないパフォーマンスを評価の対象とすれば良いわけです。
では、どんなケースがノイズといえるかというと
・守備機会としてはそれほど多くない
・守備の成否が実力ではなく運によって左右される
こうしたケースはノイズと見て良いかと思います。こうした守備のケースを除いて行って、残った守備機会での成績を『コアな部分』といって良いのではないかと考えるわけです。
そして、守備のスタッツであるOAAでは、これまで扱ってきたように、野手からボールまでの距離と時間からこの難易度を求めます。そして野手ごとに、処理した打球の難易度ごとに守備機会を集計しています。具体的には以下の5つの☆によって分類されています。
☆☆☆☆☆(0-25%)
☆☆☆☆(26-50%)
☆☆☆(51-75%)
☆☆(76-90%)
☆(91-95%)
こうした難易度別の守備機会から、ノイズとなる部分を除くことはできないでしょうか?それをやるには、どのあたりの難易度がノイズとなり得るか?というところから検証が必要です。あまり面白い分析ではないかもしれませんが、この辺りを2021年はコツコツ積み上げていこうかと思います。
上手く行った暁には
この評価方法が上手く行けば、守備のスタッツを、野手のコアな守備能力と、ノイズの偏り、つまり運の良し悪しによる加点or減点分という2つの要素で評価できるようになるかと思います。現段階では夢は大きくといったところですが、目標としてはふさわしいかと思います。
こんな感じで2021年はいくつかのテーマを並行して進めていくつもりです。
本年もよろしくお願いします。
タイトル画像:いらすとや