野球指標(x)wOBAの解説と、xwOBA推定の話
はじめに
このnoteでは、日本ではマイナーだけど実は有用な野球指標wOBA・xwOBAを紹介します。後半では実際にxwOBAを推定するというニッチな話もします。
分かりやすさを重視しているため、あえて曖昧な表現になっている部分があります。ご容赦ください。
MLBの成績サイトを見ると、「wOBA」や「xwOBA」という指標をよく目にします。例えば大谷翔平選手のBaseball Savantのページを見ると、wOBA・xwOBAという文字が何度も出てきます。
また、最近wRC+という指標を野球界隈でもよく見かけるようになりましたが、wRC+の算出にはwOBAが使われています。
wOBAとは?
wOBAはOPSや長打率と似ているもので、打者の成績を表す指標です。
wOBAを一言で表すと、「1打席あたり得点貢献度」です。
参考までに、2024年NPBのwOBA 上位5名とwOBAの目安です。目安としては出塁率に似ていますね。
続いて、wOBAの中身を見て行きましょう。
wOBAの計算式は以下のようになっています。
とてもわかりにくいですね。
多くの人が思うwOBAの謎ポイントはこれだと思います。
「1.334×二塁打の1.334って何やねん。二塁打やから×2で良くない?」
OPSの片割れである長打率は、わかりやすく二塁打なら×2、三塁打なら×3と進んだ塁の数をかけています。
それに対してwOBAの細かい掛け算の数値は、得点への繋がりやすさを表しています。二塁打は1.334、ホームランは2.065だけ得点に繋がりやすいという認識で大丈夫です。厳密には単位の話がありますが、難解になるのでここではしません🙇
wOBAは、単打や二塁打に得点への繋がりやすさをかけて合計し、打席数で割ることで「1打席あたり打撃でどれだけ得点に貢献したか?」を表す指標というわけですね。
よってwOBAはOPSよりも得点との関係が深い指標です。
ただ、OPSも十分得点との関係が深いため、日本ではOPSが主流です。
新世代指標* xwOBAとは?
MLBの大手データサイト Baseball Savantでは、wOBAの前にxがついた「xwOBA」や「xwOBAcon」という文字をよく目にします。
xwOBAは、wOBAの推定値・期待値で、「この打者ならこの成績であるべきだろう」という数値です。
なぜ推定値・期待値を出すのか?と思った方も多いと思います。
それはwOBAが打率などと同様に、守備や環境の影響を受けるからです。
今季の巨人のように内野が強固なチーム相手と、その逆のチーム相手とでは同じゴロでも前者はアウト、後者はヒットになるかもしれません。
捉えた打球で多くの球場でホームランになる打球でも、バンテリンでは外野フライになることもあります。
打球とは関係ない要素に成績が左右されては、打者本来の力を正しく評価するのは難しいです。
それらを排除して、「打った打球の質が統計的にどれだけ価値があるのか?」(=打球の期待値)で打者を評価しようというのがxwOBAの思想です。
正確にはxwOBAは打球の質+四死球で算出され、打球の質の部分はxwOBAconと呼ばれます。2019年からは打球の質に加え、打者の走力も考慮されるようになりました。
例えばヤンキース フアン・ソト選手の今シーズンのwOBAは.421ですが、xwOBAは.462です。
このようにxwOBA>wOBAとなっている場合、統計的に質の良い打球を多く放っているが、守備や打球運で損をしている可能性があると考えられます。
考え方としてはBABIPに似ており、xwOBAは上振れ・下振れの話の根拠にされることも多いです。BABIPとの違いは、xwOBAは「1つ1つの打球の質を考慮して」算出される点で、何かの値に収束することはありません。
xwOBA(con)は過去の打球パターンから推定されるため、計算式はありません。以降では実際にxwOBA(con)を推定します。
*新世代指標と書きましたが現れたのは2015年です。他の主要指標と比較して新しいという意味です🙇
100万打球からxwOBA(con)を推定する
MLBの過去100万打球の結果から、xwOBA(con)の推定を行います。
まず、打球の結果を予測するモデルを作成します。これにより、「鈴木誠也選手の放った166km/h 33度の打球は71%の確率でホームランになる」のような推定ができるようになります。
説明変数として以下の3つを使用しました。
①打球速度・打球角度
②打者の走力
③スプレー角度(球場を俯瞰した際に、打球とフィールドが成す角度)
スプレー角度を入れたのは、同じ角度・速度の打球でも、引っ張り方向・流し方向・センター方向ではフェンスまでの距離に差がある点や、ボールへのスピンのかかり具合が異なる点を考慮しました。
①をベースに、②・③と加えていった場合の予測精度の変化を見ます。
Baseball Savant記載のxwOBAは一般化加法モデル(GAM)とk近傍法(kNN)を基に算出しているようですが、異なるアプローチでモデルを作成しました。
結果としては80%前後の正解率で打球結果を予測できるようになりました。
興味深いのは、②打者の走力を加えても打球結果の予測精度に差が出なかった点です。内訳を見ると、シングルヒットの予測精度が少し上がった分、アウト打球の予測精度が少し下がり、相殺された形になっていました。また、③打球方向(スプレー角度)を加えることで精度が大きく改善したのは仮説通りでした。
作成した3個のモデルを使って算出したxwOBAcon(四死球を除いたxwOBA)と、Baseball Savant記載のxwOBAconの年度間相関を比較します。(2021年-2024年 400打席以上の打者が対象)
分析的観点で指標を見る際は年度間相関が大事で、年度を跨いでも一貫性がある=その指標はプレイヤー固有の能力を反映しやすいと考えられます。
打球速度・打球角度のみのモデルが最も一貫性のある結果となり、Baseball Savantをやや上回る年度間相関を出すことができました。
ここで注目したいのは、打球方向(スプレー角度)を説明変数に入れた③のモデルの年度間相関が一番低かったことです。打球方向により打球結果の予測精度は改善しましたが、打者本来の能力という観点でノイズのように働いたのは面白い結果でした。
また、同期間・同条件のwOBAconとOPSの年度間相関はそれぞれ0.60と0.47であることを考えると、xwOBAconが他指標と比較しても、打者本来の能力を反映した指標だと考えられます。
最後に日本人選手の今季のxwOBAconを貼って終わりたいと思います。大谷翔平選手はあの成績から更に上がっていた可能性があるのは凄いですね。
最後までお読み頂き、ありがとうございました🙇
参考文献
wOBA 1.02 ESSENCE OF BASEBALL
Shohei Ohtani Stats Baseball Savant