過去のERAが過去のFIPよりも将来のERAをより予測するようになるのはいつですか?

要約

WARの中核指標に、Fangraphs(fWAR)はFIP、Reference(rWAR)はERA(正確にはRA/9)を用いている。
投手はFIPの方が1 seasonを正確に表し、ERAやRA/9の方がcareerを正確に表すという前提両者が等しく意味を持つのは、5〜8 season程度ではないかと推測した。

1seasonを200IPと考えると、9イニング試合が約22回。5-8 seasonは110試合から176試合。1~3seasonだとfWAR75%rWAR25%、10season以上だとrWAR75%fWAR25%の重み付けはどうかと推測

なぜERAがFIPに取って代わると思うか理由

FIPはSO、BB、HBP、HR以外を完全に無視しているので、最終的には70%の確率で発生したBall-in parkingが欠落したものが小さなsample sizeのnoiseから抜け出す信号として作用するのは当然。大きな問題だ。最終的に、投手のBABIPは、FIPのように完全に無視するのではなく、重要視され始める。他にも出塁率に関わる小さな事柄がたくさん。SB、CS、PK、BK、WP、PB。 また、投手が試合中にhitを散らばるか、1イニングにhitを集中させるか、eventの順序も。

ビル・ジェームスの古い記事に、無関係の問題(ムッシーナとホフマンの殿堂入り)で、まさにこのテーマを論じていた。彼は、ERAが捉えている物、FIPが無視している物を全て実際に指摘している。関連部分を引用。====================================

... WARを計算する人の中には、(これも誰が何をしているか定かではありませんが)実際に許した失点ではなく、その投手個人が周辺数値から予想される失点数を計算式で推定して価値を計算している人もいるかもしれません。トレバー・ホフマンのcareerERAは2.87だが、奪三振、与四球、被本塁打に基づくFIP(Fielder Independent Pitching)は3.08、一方、マイク・ザ・ムースはcareer ERA3.68だが、その周辺数値に基づくFIPでは3.57である。

ここでもまた、疑問の残る調整。投手は、三振や四球、本塁打、安打を与える以外にも、ERAに何らかの影響を与える事をたくさんしています。

a) 走者をうまく抑えるか抑える事ができない。
b) runnerを選ぶ。
c) 自分の positionを守る。
d) wild pitchを投げる
e) ground ballを誘う。
f) 状況に応じた投球を一定水準で行う。
SEASON dataを把握する場合、ERAとFIPの乖離は、おそらく投手がControlできないrandomな要因がほとんどであり、ERAよりもFIPを優先すべきなのだろう。しかし、数百イニングに及ぶcareerの記録を扱う場合、つまりここではcareer記録を扱う場合、ERAとFIPの不一致は上記の(a)〜(f)の要因によって生じる可能性が高く、その場合は実際ERAがより有益な数値である事はほぼ間違いないでしょう。より洗練されたsabermetrics分析では、小さなdata群を扱う場合はFIPに依存し、個々の投手のイニング数が多い場合は実際のERAに依存する。
======== 終了

これはまさに私の見解と一致する。ビルと私、おそらくみんなが、この件に関して同じ直感を持っているでしょう。ある時点で、本当の野球の出来事が重要になり始める。その点を見極めるのがセイバリストとしての仕事だ。ビルは、数百イニングという斜め上の言及以外に、FIPよりERAが優先されるswapがいつ起こるかは推測していない。しかし、概念的には、彼と私は一致しています。まあ、今日まで言ってきたようにね。

研究内容

1998年から2021年まで全投手について、これまでのcareerERAとcareerFIP、OUT数を1試合ごとに質問。

例えば、2008年5月30日の時点で、ジャスティン・バーランダーは76試合に登板している。その時点で、彼は1422outを記録し、209ERを許し、現在までERAは3.97である。その後、彼は8067OUTを記録し、3.11のERAのための930失点。バーランダーは2021年まで454試合あるので、私がバーランダーに対して持っているこのような答えの数。これを1998年以降の全投手について繰り返した。

この5月30日の試合では、これまでのcareerで1422個OUTをとっているので、それを27で割って1試合あたりのOUT数に換算すると、9イニング×52試合分。つまり、これまでの52試合では、ERA3.97。この先行52試合には346人の投手が含まれる。この投手たちのERAと残りのcareer ERAの相関を調べると、r=0.35。さらに、FIPとcareer通算ERAを比較すると、r=0.47となる。結論は?9イニングの試合が52試合ある場合、これまでのERAよりも、FIPの方が残りのcareer ERAを決定する上で有益だとわかる。これは、2~3 seasonに相当するため、驚く事ではありません。

そこで、これを53、54...と繰り返してみると、それなりに。137試合までは、将来ERAは、常に現在FIPの方が現在ERAよりも高い相関を持つ。137試合は私の予想の範囲内なので、かなり安心した。ERAが入れ替わるpoint?いいえ、そうではありません。実は138〜173試合まで、一進一退を繰り返し、この間のERAとFIPは、同じくらい今後の参考になる。ERAが優位に立つのは、その前の174試合、185試合まで(およそ8〜9 season)を見るまで。それ以降は、再びFIPが支配する。

結論

保守的に考えて、9イニング✕138試合=1242IPがERAとFIPが同じくらい参考になるpointで、どれだけ情報が増えてもそのまま。いずれ入れ替わりが起こるのは私の勘違い。そんな事はない。FIPが好まれるのは、1 seasonから数 season。FIPとERAが同等に好まれるのは、7 season以上。

ビル・ジェームスが持ち出した点は、合理的と同時に、私が過去20年間それを信じてきたのと同様に、まあ、この特別な証拠はsupportするものではない。Aspiring Saberistsがここで何ができるかを見るのが楽しみ。

FIPは初期に大きなリードを取り、長年にわたって強く維持し、FIPとERAは基本的に互角になり、そのままの状態を保っています。

追記

FIPは記述的統計であり、予測指標ではない事を再確認する必要。 FIPは実データを使用し、単純に重み付けしてscalingしているだけ。
様々な事象(single、double、triple、home run)に重みをつけ、それ以外(WALK、 hitbatter、STEAL、Wild pitchなど)を無視するSLGと何ら変わりはありません。
SLGは、それ以外が重要でないと言っているのではなく、 単にやろうとしている事のためには必要ないと言っている。
OBPは、四球とHRのImpactが同等だと主張しているのではなく、塁に出るという測定目的においては同等であると言っているに過ぎません。

つまり、FIPは投球の一面を表現している。

そして、上記研究から、ERAはrandom変動を含みすぎている事が分かる。
もしBall in Park hit、SB、WP、DPなどを含めたいならば、ERA以外の指標に含め、ERA本来のImpactを妨げている「random変動」の原因を突き止めましょう。
私の推測では、事象の順序が主で、おそらく次がBall-in-parkのHITでしょう。

考慮すべき事の1つは、FIPが球場要因を完全に考慮していない
FIPは、特定球場のHR、BB、K率の球場主導要素を説明しているが、これらの eventがその特定球場で失点する方法を必ずしも説明していない。
そのため、FIPとERAの間には、環境要因に基づく予想される差が厳密に存在する。極端なpitchers parkでは、一般的にFIPよりもERAが低くなり、逆もまた然り。
このため、球場や天候を調整せずにERA-FIPを正確に計算し、情報を得ようとするのは、(どのような期間であれ)良い考えとは言えない。(例外は、同じようなscheduleで登板したチームメイトの場合だ)。
FIPのsimpleさの魅力は理解していますが、特定pitcherの実際ERAと比較すると、SequencingやBABIP以上が欠けています。

解釈するのが難しい事の1つは、従属変数が絶えず変化。既にpitching試合のsampleが増えるにつれて、残りのゲームのsampleは縮小。pitcherの才能の評価がより正確になるにつれて、彼の後期 careerの才能の評価は精度が低下。
さらに、老化の合併症があります。初期の頃は、prime/late career依存変数を予測していますが、その後は careerの終わりに過ぎません。そして、キャリアが長い投手は、チームを変更したり、リーグの状況に大きな変化を経験したりする可能性が高くなる。それは多くの可動部分。
意欲的なセイバリストがpitcherのperformanceを予測すると、これがどのように見えるかを見るのは興味深いでしょう(そして、残りのIPが180未満になったらpitcherを除外します)。pitcherの現在の才能を予測してみてください。ERAがFIPに追いつかないのはまだ事実ですか?

#3 タンゴティガー 

  • careerERAとFIPの影響:残りのcareerERAは公平であり、現在の-ERAに対してFIPと比べて大きな影響を与えるとは考えにくい。FIPが結果に急浮上する場合もあるが、それによって結論が変わることはない。

  • セイバー主義への挑戦:この議論はセイバー主義者にとっての大きな一歩であり、さらに研究や改善を進めるための出発点となる。新しい手法や見解を求める意欲的なセイバー主義者には大きなチャンスがある。

  • ノイズとサンプルサイズの影響:200試合以降の結果に奇妙な動きが見られるが、これはノイズが追加されるためであり、残りのサンプルは約75人の投手で構成される。その中で多くの投手は200イニング未満しか投げておらず、この結果にはあまり信頼を置いていない。

  • 最終的なサンプルの限界:最終的には約30人の投手にサンプルが絞られ、そのcareerは200イニング以下になることが多い。180付近で「STOP」pointを置くことができ、その後のデータはあまり重視されない。

  • Marcelsの改善提案:Marcelsの予測モデルでは、ERAの代わりにFIPを使用することでわずかながら改善される可能性が示唆されている。また、MarcelsはERAを「component ERA」(BaseRunsやwOBAを使用)に分けている。

  • 歴史的分析の提案:過去の時代(80年代〜90年代、60年代〜70年代、40年代〜50年代)のERAとFIPのパフォーマンスを比較し、特にK率やHR率が低かった期間にFIPがERAを上回ったかを検証するプロジェクトは、意欲的な研究対象となり得る。






この記事が気に入ったらサポートをしてみませんか?