バスケットボールの指標を考える:コート上での「貢献」について
バスケットボールはデータの多いスポーツで,1試合ごとのBoxScoreや1プレイごとのplay-by-playなどでそれなりの量のデータが生成されます.「伝統的」な記録である得点,リバウンドなど,単純な事象の生起回数にはじまり,それらから加工して生成されたeFG%など選手評価の指標はさまざまです.eFG%をはじめとするFourFactorsについては以下の記事が面白いです.
それらは選手の成し遂げた記録であるわけなのですが,その一方それらの記録を成立させるために「記録されない貢献」があるわけです.
たとえば,ピックアンドロールでスクリーナーとなった選手には伝統的な指標では記録がつきません.また,「あのセンター強力だからインサイドは避けるかな・・・」「高さのミスマッチが起こったからあそこにパスは出せないな・・・」といった,そもそもプレイを選択しなくなるような影響については「起こっていないことを記録する」といった矛盾が付きまといます.
短期的な勝敗をコート上全員で分配する新指標を提案
「記録できない貢献」の問題について,ここでは「短期的な勝敗をコート上全員で分配する」という観点での定量化を試みます.ここで「短期的」というのは,いわゆる1ボールポゼッションとほぼ等しいと考えてください.
ボール保持チームの短期的な勝利は「得点すること」です.逆に,ボール保持側が得点することなくボールを失うのは短期的な敗北(そして,守備側の短期的な勝利)です.
これを基本とし,
・オフェンスリバウンドは「シュート失敗(1敗)」「ボール獲得(1勝)」とする,
・守備のパーソナルファウルはフリースローになるまでは勝敗どちらともつけない,
などの修正を加え,play-by-playのデータからコート上の選手と短期的勝敗を関連付けます.通常はプレイの最後(シュート,スティール,ファウルなど)に関与した選手のみが記録されるところを,それが起きた時点でコートにいた全員に分配することで「記録されていない貢献」を定量化しようというアイデアです.
そして,短期的な勝敗を攻撃,守備5名全員のパラメータの和からロジスティック回帰モデルで説明できると仮定し,パラメータを調整します.言い忘れていましたが,各選手は攻撃・守備2つのパラメータを持つと仮定します.これにより「どの相手に対して短期的に勝利・敗北したか」を反映させます.
結果:Bリーグ2017-18シーズン
手始めに2017-18シーズン全試合に対して,攻撃・守備の貢献の和の上位15名を示します.貢献は1プレイ当たりの値で,出場数が少ない選手は除外してあります.
攻撃・守備はそれぞれリーグ平均との差を示しています.青と黄色のバーの長さが攻撃・守備それぞれでの1プレイ当たりの貢献を示しています.攻撃ではファジーカス選手,守備ではカーク選手がトップで,合計ではカーク選手がトップでした.横軸の0.1は,平均的な選手と入れ替わったときに攻撃・守備それぞれでの短期的な勝率が0.025上昇することに対応します.
既知の問題点
攻撃についてはシュート成否の割合に基づく指標なので,3Pが多いチーム・選手に対しては低く出る傾向にあります.
また,完全に同じタイミングでずっとコート上にいる2名の選手がいた場合,その2名の貢献は区別できません.
選手の活躍を得点に換算したReal Plus-Minus (RPM)という指標ではこれらの事情を考慮したモデルを作成しているようなのですが,これは現在勉強中です.今のところの感触としては,測定したい量やその意図が似ているけれども異なる指標になっているかな?という感じです.