マルセルの...WARcels?
マルセルズの基本構造とその価値
WARcels?
マーセルズの予測システムはシンプルで透明性があり、選手成績予測の最低基準として時の試練に耐えてきた。
2.著者は「WARcels」と呼ばれるさらにシンプルなシステムを提案している。これは、他の要素やplay時間を一切考慮せず、選手の過去のWAR値のみを用いて将来のWARを予測するものである。
打者の予測手順は以下の通り:
T年目のWARの60%、T-1年目のWARの30%、T-2年目のWARの10%を加重平均する。
加重平均に80%回帰を適用する。
選手の年齢と 30 歳との比較に基づいて予測を調整し、1 年あたり 0.1 WAR を加算/減算する。
投手については、投手の成績がより早く低下することを考慮し、30歳ではなく26歳を基準に年齢調整を行う。
このWARcelsの方法を用いて5年間のWAR予測を行い、エドウィン・エンカーナシオンのような選手の過去のコンプと結果を比較している。
WARcelsのアプローチは、より多くの変数を組み込んだMarcelのような複雑な予測システムとは対照的に、WARをinputとして使用するだけという、意図的に非常にシンプルなものである。
WARcels法が、プレー時間にばらつきのある選手のような特定の状況をうまく扱えない可能性があることを指摘し、そのようなケースはMarcelのようなシステムで扱う方がよいと示唆している。
全体として、WARcelsのコンセプトは、選手の過去のWAR値のみに依存する、さらにシンプルな予測アプローチの探求として提示されている。
WARcelsのシンプルさとその可能性
• シンプルさの意義:WARはすでに選手の成績を包括的に評価する指標であり、特に複数年にわたるデータを扱うことで、パフォーマンスをまとめて評価できます。そのため、余計なデータを付加せずとも、十分な精度で選手の将来を予測できるという考え方です。
• 実装方法:基本的には、マルセルズの手法を踏襲しつつ、WARデータのみを使用します。プレイ時間や打撃、投球などの詳細な成績を使わないため、非常にシンプルな計算で予測が完了します。これにより、計算が簡便化され、より素早い予測が可能になります。
他のシステムとの比較と適用範囲
他の予測システムと比較した場合の違いは、特にシンプルさと予測精度のバランスにあります。
• ZiPSやSteamer:選手の細かいパフォーマンスデータ(例えば打球の速度、打球角度、投球の回転数など)を利用し、より詳細で複雑な予測を行います。そのため、特定の状況では非常に高い予測精度を誇りますが、計算が複雑であり、専門的な知識が必要です。
• マルセルズ:計算が非常に簡単である一方、複雑な要素を無視するため精度に限界があります。しかし、シンプルであるため、日常的な予測やbaselineとして使用するには十分な機能を備えています。
• WARcels:WARのみを使ったこのシステムは、最もシンプWARcelsの限界と改善の方向性
STEP1:STEP2:上記と同じ
STEP3:30歳からではなく、26歳から。
T+2年: T+1年の予測から0.4勝減算
T+3年: T+2年の予測から0.4勝減算
T+4年: T+3年の予測から0.4勝減算
T+5年: T+4年の予測から0.4勝減算
Pitcherの場合は年齢を心配する必要がない。ただし、高いWARを持つ選手は年齢が重要であり、モデルを微調整する必要がある。
負傷選手や少ない出場時間の選手は外れ値となりうるが、適切な重み付けを行えば予測に大きな影響を与えないかもしれない。
WARcelsは season WAR、誕生年、pitcherかどうかの3つの情報しか使わないが、それ以外の変数を使いたい場合はマルセルを使うべきである。
不均一な出場時間は課題となるが、WARcelsとマルセルを組み合わせることで適切に対処できると考えられる。