得点と失点を使って、チームの勝率を予測する(1)
「Rによるセイバーメトリクス入門」を教科書にして、展開をしていきます。最初は。。
得点と失点を使って、チームの勝率を予測する(1)
予測モデルは、単純な線形回帰です。当たり前ですが、野球とはゲームセット時点で相手チームよりも得失点差が上回っていれば勝利、同点なら引き分け、下回っていれば敗戦。なので、得失点差と勝率には正の関係があるはずです。
セ・リーグの1950年〜2024年の成績を使用して分析
細かい内容は本を買って読んでいただくとして、いきなり結論です。
勝率=0.5002783 + 0.0007625 x 得失点差
これが「セ・リーグ74年の戦いから導き出された一つの結論」、と思うと感慨深いものもあります。。「シーズン終了時点で得失点差がゼロであれば、勝率はおよそ5割」という期待値通りの結果ですね。極論、1-0の勝利と0-1の敗戦を繰り返せば、得失点差ゼロで勝率5割と。
「得失点差1」の重みが0.07%。100点差あると、勝率はおよそ.576。実際はどうだったのか?直近2年間の順位表で確認してみると、2024年首位のジャイアンツの得失点差(RD)は81、勝率(Wpct)は0.566。予測モデルから導き出される勝率は0.562。ほぼ一致します。2023年首位のタイガースの得失点差は131、勝率は0.616。予測モデルの勝率は0.600。こちらもほぼ一致。
我がベイスターズの2024年は得失点差19、勝率0.507。予想モデルの勝率は0.515。得点(Runs)はセ界最強の522、しかし失点(Runs Allowed)は503と下から2番目。点取っても、取られたら勝てません。CSの様な守って勝ち切る野球がシーズン通してできれば、無駄な失点が減らせて勝率は上がることでしょう。。
グラフにすると、綺麗な順相関。。
先のモデルの決定係数はR2=0.85141。
点は取っても取られるな!
というわけで、今回の結論は「点は取っても、取られるな」。無駄な失点を減らせば、得失点差が増えて勝率が高まります。ディフェンス力という意味では、投手陣だけではなく、野手の守備力も重要です。来年はベイス⭐️ボールが減ることにも期待したいと思います。。