打撃とピッチング(スタッフを含む)メトリクスの更新された評価

人気のある投手と打者のMetricsのperformanceを評価してからしばらく経ちます。Statcastの打球データが継続的に統合された事で、より競争力のある分析の選択肢が生まれました。また、選手のperformance、特に投球の特定の側面を説明する事に焦点を当てたMetricsが、選手のperformanceの予測のために推進されているのを目にするようになりました。今週から、投手と打者をそれぞれ評価するBPのCatch All MetricsであるDRAとDRCが、Statcastの入力で更新されました。そのupdateを踏まえて、ある種の「staff」メトリクスを含む他の投手と打者のMetricsに対して、それらのupdateされた変種を評価することにします。

我々は、class最高の総合的なメトリクスはこれまで以上に優れたperformanceを発揮しているが、「staff」メトリクスを使用して将来のERAを予測する際には注意が必要であると結論付けた。特に、少なくとも1つの「staff」 systemの2021年からの評価は、全体として投手の2022年のERAと相関しているが、この効果はteamを移籍しなかった投手によってもたらされるようであると分かった。投手のskillはportableであるべきであり、投手の結果がどのteamで playしているかに依存する場合、測定されているのはteamや球場の特性であり、投手自身のskillではない可能性があるため、これは重要である。投手自身の能力よりも、球団が投手の武器庫をどのように使用するかによって、投手ERAとstaffメトリクスの関連性がより強くなる可能性がある。

背景

野球アナリストが選手の成績を測る伝統的な指標、打者なら「Slash line」、投手なら「ERA」は、一部の人が認めるほど有用ではあるが、それでもアナリストは何十年もかけて、その成績を改善しようと試みてきた。

少なくとも公には、投手に対するこうした取り組みには、投手の貢献をよりよく評価するためのかなり複雑な計算式、より単純な計算式(FIP)、FIPを改良するいくつかの試み(xFIPやSIERA)、DRAなどの最近の評価基準があります。

打者については、3つのTriple slashのうち2つを加算したOPS(On-Base-Plus-Slugging)、投手よりも打者に多く適用される擬似二項尺度に、利用可能な打撃eventの結果のほとんどをscalingしたwOBA(Weighted on-base average)、およびOPS+やwRC+などの測定基準をそれぞれ球場調整したvariationが、同様の取り組みを行っています。

Statcast systemのrelease後、 Major Leagueは「予想wOBA」(xwOBA)を発表し、wOBAを「not in play」イベントと「ball in play」event(それぞれ「NIP」「BIP」)の2つに分類した。NIP eventについては、xwOBAは、その生の値が打者と投手の貢献を正確に測定していると仮定し、調整なしでその値を受け入れる。BIP eventについては、xwOBAは、ballの発射角度とbatからのspeedの組み合わせによって予測されるBIP結果の平均値に基づいてwOBA値を割り当て、特定のBIPtypeについては打者のrunning speedを調整する。

BPは、複数の世代にわたって独自の指標を開発してきました。2016年、文脈的FIP(cFIP)を導入した後、次にDeserved Run Average(DRAまたはDRA-)を導入し、パークや対戦相手の質をControlし、in playかin playでないかにかかわらず、全ての結果に懐疑的という一般原則を適用して、投手が最も貢献したと考えられるものを分離しようと試みています。 DRAは長年にわたり複数の追加要素を検討してきたが、最近ではより基本的な要素にこだわっている。play参加者、球場、platoon、先発対リリーフ、ホーム/アウェイが主なものである。DRAの主な目標は、FIPよりも優れた成績を残す事であり(そうでなければ、なぜ悩むのか)、我々の測定では、一貫して達成している。

DRA が成熟し始めた後、私たちは打撃の分野にも進出し、類似の打撃指標である Deserved Runs Created (DRC+) を開発しました。DRCはDRAの鏡像であり、類似モデルを用いて、状況を考慮した上で、各打撃イベントのタイプに一貫した実績がある場合にのみ、打者の功績を評価するものです。DRCがreleaseされた時、一部のcommentatorは、更新された打撃指標のリリースは不要であると感じたようです。 しかし、DRCの成績が示すように、OPS+やwRC+といった従来の指標では、打者はBox scoreで評価されすぎ、実際に貢献したと思われる打者については十分に評価されていなかったのです。最終的な成績は重要だが、その成績と打者の貢献度は別物である。

この歴史を振り返ってみると、いくつか傾向が見れます。

 eventの連結と平滑化
まず、特に投手については、個人的な価値がないと思われる事象を無視したり、平滑化したりする傾向があります。最も有名なのはFIPで、投手のNIP event(HBPを含む場合もあれば含まない場合もある)とBIP eventの1つであるホームランだけを計算の対象に加えています。 FIPは「投手が最もControlできる」事象に着目していると説明される事が多いが、これは間違いである。FIPの焦点は「野手に依存しない」打撃事象であり、それ以外の事象ではありません。偶然にも、これらの事象は、頻度と得点の組み合わせにより、最も大きな得点の結果をもたらすものでもある。これらの事象の内、いくつかは投手が最もControlできる事象(三振と四球)である。投手がホームランをControlする能力は限られていますが、ホームランを除外すると、kwERAとなり、投手のスキルを説明する便利な変数となりますが、失点の仕方を説明するのにはあまり役立ちません。一方、xFIPは、NIP事象はそのままに、投手のfry ballの代わりにリーグ平均のhome run率を代入しています。これは、投手の貢献度をよりよく表すという点では改善されていますが、投手が実質的にControlできるBIP categoryであり、四球よりも価値が高く頻度も高いsingle ballを拒否し続けている点で奇妙なものでもあります。

他の指標では、事象の中から選択するのではなく、事象を完全に無視します。SIERAはERAに線形回帰し、事象をERA全体の結果の予測因子として扱い、奪三振率を出塁率と一緒に直接考慮します。SIERAは少し荒いスタートを切ったが(ほとんどの新しいメトリクスがそうである)、それは一見古い係数にもかかわらず、全体としてうまく機能し続けている。回帰モデルや機械学習モデルを作成し、有用であることが分かっている予測因子の束をスープに放り込み、期待される出力を予測するために最適と思われる入力の組み合わせを見つける方が、より簡単である。DRAも当初はそうしていましたが、DRAの一時的な寵児であるジェイソン・シュミットが指摘するように、そのエッジは非常に鋭かったのです。私たちはその後すぐにこの「すべてを滑らかにする」アプローチをやめ、実際の打撃イベントの結果を予測し、その結果がもたらすランバリューの結果を集計することに重点を置くようになりました。

DRA と DRC は、三振、四球、安打、内野ゴロ、単打、二塁打、三塁打、本塁打など、興味深いと思われる個々の打撃事象のモデリングにこだわる(古風?このアプローチは、これらのイベントをオーバーフィットさせる危険性があるため、より困難である。しかし、この余分な努力はDRAとDRCの利点になります。三振率、二塁打率、本塁打率など、ある投手や打者の評価が低い理由を知ることができます。その結果、読者は選手カードを見て、ある選手がどこでどんな評価を受けているのか、その理由を知ることができます。各打撃イベントごとに独立したデスパーレートやラン値を見れば、DRA/DRCが各選手の強みと弱みを平均と比較してどのように見ているかがわかり、これらの指標がなぜそのような結論に至るのかを理解するのに役立ちます。

例えば、クリスチャン・イェリッチが2018年にブルワーズに入団して以来、単打・二塁打ともに平均以上の打者から平均以下の打者になり、その傾向はMVPへの移行から再びMVPに戻るまで一貫していることがわかります。そのMVPの段階では、やや平均以下のホームランバッターから平均を大きく上回るホームランバッターになり、現在は平均以下のホームランバッターに戻っている。しかし、四球による得点貢献は当初からどんどんプラスに転じており、これは今でも彼に価値を与えている「オヤジスキル」の一つである。

スタットキャスト
2015年のMLBシーズン中に直接測定された打球データが利用できるようになったことは、驚くべきことでした。ホームランの背景にあるインプットをファンがより理解できるようになったことに加え、この測定によって、プレー参加者とプレー結果の間の因果関係の連鎖の新しい部分が埋められました。Statcastによって、アナリストはヒットを典型的な結果と非典型的な結果に分類し、誰の結果が他よりふさわしいかを解明することができるようになりました。なぜなら、打球の測定値は入力ではなく出力であり、打球の測定値をスキルと同等に扱うことは、特に投手にとってリスクが高いからです。選手の最も可能性の高い貢献を評価するには、打球計測値を作成する際の選手の役割を評価する必要があり、打球計測値がどうなったかについて選手が完全に責任を負うと仮定するだけではない。

この新しいStatcast時代の最も顕著なアバターは、前述のxwOBAである。この指標の初期の取り組みは、この手のものではよくあることですが、少々荒っぽかったです。導入直後、私たちは投手の場合、xwOBAはFIPより劣り、DRAより劣るというアドバイスをしました。同様に、DRCの導入時には、打者については、DRCとxwOBAが他の指標よりも正確なクラスである一方、DRCは、我々が関連すると考えるベンチマークにおいて、xwOBAよりも良いパフォーマンスを示していることを確認しました。これまで、DRA と DRC は Statcast の入力を取り込んでいませんでしたが、これはさらなる複雑化を避けるためでもあり、また必要ないと判断したためでもあります。

もちろん、すべてのものは最終的に変化するものであり、最近になって、xwOBAが前回の評価から大きく進歩したことが明らかになった。この改善は、サム・シャープが議論したこれらの変更と、MLBが2020年に使い始めたホークアイシステムによって与えられた追加の精度の組み合わせによるものかもしれません。原因が何であれ、xwOBAが以前よりも(我々の測定で)著しく正確であることは明らかであり、その改善の結果は、評価と見直しの両方に値する。

xwOBAのこれらの改善は、DRCとDRAがもはやStatcastの傍観者であることを意味し、今日、彼らはもはやそうではありません。両Metricsとも、ホームランやシングルなど、その影響が建設的であると判断した打撃eventについては、Statcastのインプットを取り入れるようになりました。この追加により、両指標は、他の指標と比較して、私たちが好ましいと考えるパフォーマンス・レベルにまでジャンプ・バックしました。Statcastの測定値をインポートする仕組みについては、別の記事で取り上げます。今のところ、コンポジットとスプリット(プラトーンなど)のDRA/DRC値の両方が、Statcastが公開されているシーズンとリーグにおいて、Statcastから適切な利益を得ていることにご安心ください。

ヒッターメトリクス、一般的に
2018年にDRC+を導入した際、私たちの立場から、2つの指標が他の指標よりも打者にとってはるかに良いパフォーマンスを発揮するとコメントしました:DRC+とxwOBAです。これは今も変わっていません。

私たちは、スポーツ選手の計測の正しい目的は、各選手の結果だけでなく、最も可能性の高い貢献度を決定することだと考えています。私たちはすでに、選手の結果を示す情報源を持っており、それは「Box score」と呼ばれています。同様に、私たちはすでに確立された選手のスキルを評価する手段を持っており、それは "Projectionシステム "と呼ばれています。seasonを通して最も貢献しそうな選手を評価することは、この2つの両極端の間に位置する。しかし、結果は複雑であり、選手の技量を完全に反映するものではないことを認識しています。私たちは未来を予測しようとしているわけではありませんが、同じようなスキルを持つ選手は平均して同じような貢献をすると予想されるため、同じ選手を長期にわたって同じように評価する指標を期待します(「信頼性」または「粘着性」の概念)。また、望ましい結果が明確に定量化できる状況では、これらのPlayerの将来の結果をより良く予測することが期待できます(「予測性」)、なぜなら同様の評価は平均して同様の結果と一致するはずだからです。また、それに付随して、同じシーズンの結果を正確に記述する「記述性」という概念についても議論してきましたが、一貫した使い方を見つけるのに苦労しています。

ビジネスへ2021年と2022年のseasonは、Hawkeyeを解き放つ最初のフルシーズンであり、2023年シーズン以降の打者と投手のメトリクス間で起こりうるパフォーマンスの違いを最もよく表しているものである。先日の守備比較でもそうでしたが、ここでは2021年から2022年まで、同じ選手を評価する信頼性で、そして2021年の指標評価で同じ選手の2022年の成績(ここではOPS)を予想する予測性で、様々な指標を評価しています。最低PAは課さず(アルバイト選手も人間です)、相関関係は各選手の両シーズンのPAを平均することで重み付けを行いました。最後に、ストレステストとして、2021年から2022年の間にチームを変えた選手に限定し、防御率や効果的でないパークアジャストメントによってメトリクスが利益を得ることを難しくしました。(これがなぜ重要なのかは、もう少ししたらわかるでしょう)。メトリクスは、Baseball Savant、FanGraphs、またはBPから適宜取得した。

重み付けされたスピアマン相関(異なる尺度でメトリクスを比較できる)を用いると、メトリクスの評価は次のようになります:

表1:ヒッティングメトリクスの比較
(2021-2022年、チームスイッチャー、平均化PAによる重み付けスピアマン)

打者評価は数年前まで2指標で争われていたが、それは今も変わっておらず、むしろその差は広がっている。したがって、DRC+やxwOBAが利用できる場合は、OPSやwOBA、wRC+(あるいはOPS+だろうが)を使って、打者の成績をまとめるべきで、攻撃的貢献の可能性を示すものではない。

xwOBAは、ボールを強く打つ選手や空中で打つ選手を好む傾向があり、Jeff McNeilやLuis Arraezのようなタイプの選手は過小評価される可能性があります。裏を返せば、ある選手の貢献度がこの2つの資質によって異常に左右される場合、DRC+は同じインプットの多くを考慮したにもかかわらず、必要以上に感心されず、また迅速に評価されないかもしれないということです。前述のように、xwOBAは個々の打撃イベントの結果を区別しないので、どのイベント(例えば、シングルとダブルの比較)が予想より多く、または少なく起こっているかを報告することはできない。しかし、MLBが独自に提供している他の指標では、コンタクトの質のような要素を呼び出すことで、これらの問題のいくつかを解決し、他の問題についてはより深い洞察を得ることができます。

ピッチングメトリクス、一般的に
まず、打者指標で行ったように、信頼性と予測性の2つの指標について、様々な公開指標を比較することから始めます。ここでは、OPSではなくRA9で予測性を判断し、両シーズンの平均IPで相関を重み付けしています:

表2:ピッチャーメトリックの比較
(2021-2022年、チームスイッチャー、平均IPによる重み付けスピアマン)

xwOBAの課題は、投手と打者がBIPの発射角度と出口速度に等しく責任を負うと効果的に仮定していることであり、これは真実ではありません。MLBのxERAは、同じ結果をもたらすはずのxwOBAをスケーリングしたものなので、別個に検討することはしません)しかし、独自の方法で、FIPよりも明らかに向上しています。

SIERA、kwERA、xFIPは、自分自身を予測するのに良い仕事をしていますが、予測性の面では結果は出ていません。これらの指標は過去に良い仕事をしたので、これは不思議なことです。これらの指標が検出できない方法で、打者と投手のアプローチが変化した可能性があります。伝統的なFIPについては、両カテゴリーで最下位となっています。FIPの信頼性が他の指標に比べて低いことは、FIPが「投手がコントロールできる」事象を記述しているという考え方を裏付けています。FIPは確かに予測力を主張しませんが、私たちの見解では、ある指標が結果とは対照的に選手の貢献を正確に測定するためには、この予測力を示す必要があり、FIPは投手の貢献を測定するために広く使用されています。

このグラフが示すように、投手の成績を予測することは確かに難しい。しかし、信頼性と予測性の両面で、DRAとcFIPは投手の貢献度を評価するための強力な選択肢であり続けています。

Pitcher Staff Metrics

最近、投手の「スタッフ」メトリクスが人気を博している。一般的には、投手の生の球種特性(別名「スタッフ」)をストライクゾーンの位置と区別し、その2つの寄与を組み合わせようとする試みが行われているようです。全体的なアプローチは、少なくとも高いレベルでは理にかなっています。

投手はもちろん複数の球種を持ち、それぞれの球種には様々な特徴(複数の移動方向、球速、リリースポイント、アプローチアングルなど)があり、それらが様々な形で組み合わさって効果的な投球術を提供する。このような複数の特徴を1つ、あるいは少なくとも数個の数字でまとめることが望ましいのですが、複数のインプットを数個、あるいは1個にまとめるのは難しいことです。球速はそれ自体で成立するインプットに最も近いかもしれませんが、プレートの真ん中に落ちる速球は速度に関係なく危険なことが多く、他のことができる投手は一般的にもっと成功することになります。

通常、「スタッフ」モデラーは、boostやバギングツリーといった手法を用いながら、最も一貫して効果的と思われる入力の組み合わせに磨きをかけているようです。彼らは、これらのインプットと、望ましい結果(ウィフ、出口速度、発射角度など)の組み合わせ、およびこれらの結果の実行値を組み合わせて、投球の異なる側面を評価する複合スコアを作成します:「スタッフ」、「ロケーション」、そして時にはこれらの複合の最終総合評価を与えます。

これらの「スタッフ」メトリクスの最も顕著なバリエーションは、適切に「Stuff+」と呼ばれ、FanGraphsの友人から入手することができます。技術的には、Stuff+システムは3つの部分を持っているようです:Stuff+(投球特性)、Location+(自明)、そしてこの2つを総合して出力するPitching+の3番目の測定値です。 FanGraphsはPitchingBotによる競合システムも公表している。

Stuff+のファンは、2つのメリットを強調する。まず、Stuff+はすぐに「安定」すると主張しています。第二に、Stuff+は、同じ情報の一部しか使っていないにもかかわらず、従来のERA/RA9推定量よりもERAの予測性が高いと主張していることである。この2つの主張について順番に説明する。

スタッフ+信頼性
私は「安定化」分析やクロンバックのアルファに関することは好きではありませんが、根本的なポイントは信頼性と同じで、指標は効果的に自分自身を予測し、時間の経過とともに同様のパフォーマンスを評価することを意味します。これは有用な指標の重要な要素であり、私はStuff+が非常に信頼性の高い指標であることに同意しています。上記で使用したのと同じデータセットを使用:

表3:Stuff+メトリックの信頼性
(2021-2022年、チームスイッチャー、平均IPによる重み付けスピアマン)

これらの信頼性の数値は、表2のERA / RA9の推定値よりも高いが、その理由は明らかであろう:Stuff+とLocation+は、投手の成績の特定のサブコンポーネントを分離しています。もちろん、これらのサブコンポーネントは個々の投手にとって一貫している傾向があります:投手は、同じような速度で投げ、年ごとに同じような投球をする傾向があります。さらに、コントロールの良い投手は、同じような球種を投げる傾向がある投手と比べると、やや安定性に欠けるものの、位置の良し悪しにかかわらず、コントロールの良さを維持し続ける傾向がある。ですから、高い信頼性は見ていて気持ちの良いものですが、期待するものでもあるのです。

スタッフ+予測力
Stuff+ ERAの予測評価は、通常、複数シーズンのStuff+評価に基づく予測システムを構築しようとする試みに依存しています。私はこのアプローチに懸念を抱いていますが、結論はこの記事で行ってきたこととそれほど変わりません:年ごとの投手の活躍をうまく予測するか、そうでないかです。そこで、上記の他の投手成績推定手法と同様に、Stuff+の予測可能性を評価することにします。我々は2シーズン分のデータしか持っていないので、2021年のStuff+の測定値が2022年の投手ERAを予測する能力をテストすることにします。

そして、そうしてみると、不思議でもあり、気になることに気がつくのです。Stuff+の愛好家たちは、Stuff+のメトリクスがERAを予測することは、一応正しい。しかし、予測されるERAは、投手とその武器に部分的に起因しているようにしか見えません。

次の表では、再びERAの予測精度を比較するが、3つのコホートで比較する:(1) 2021年から2022年の間に同じチームにとどまった投手、(2) 2021年と2022年に登板したすべての投手、(3) 2021年と2022年のいずれかの時点でチームを変更した投手。

報告された来年のERAに対する相関値は、上記で使用したRA9の予測値とほぼ同じであるが、ここでは、スタッフメトリクスの公開討論で比較対象になっているためERAを使用することにする:

表4:ERA予測、DRA対スタフメトリクス、投手ステータス別
(2021-2022年、平均化されたIPによる重み付けスピアマン)

(なお、「プラス」の指標は、ERAとは逆方向の好成績を評価するため、これらの計算ではゼロからの絶対距離を用いただけです。これは数値の妥当性には影響しない)。また、DRAは上記の投手成績推定法の中で最も成績が良かったので、DRAも含めています。

数ヶ月前のRDA(Range Defense Added)の紹介記事で、Deborah Mayoの言葉を借りると、メトリクスを「厳しいテスト」にかけることの重要性を強調しました。厳しいテストとは、選択した測定方法で本当に良い成績を収めるという正当な理由以外では、成功することが難しくなるようなテストである。私たちの場合は、全選手ではなく、チームを移籍した選手に限定してディフェンス指標を評価することを意味しました。私たちが説明したとおりです:

野手の評価は、たとえ不注意であっても、チームのポジショニングの決定や近隣の野手の質によって汚染されるべきではないのです。このような混乱要因を排除する最もクリーンな方法は、バンドエイドを剥がし、他チームに移籍した野手のベストとワーストを毎年正しくランク付けする能力で評価することです。

私たちはこの記事を通して、その同じ原則を適用しました。したがって、上記の投手表である表2では、指標のパフォーマンスを比較するために、もっぱら球団移籍の投手を使用しました。表4のDRAの推移は、表2の他の確立された指標からもわかるように、既存のチームにとどまる投手で最高のパフォーマンスを発揮することを反映しています。球団に残留した投手から全投手へ移行すると若干の減少が見られ、球団を移籍した投手のみに移行すると、さらに若干の減少が見られる。

Stuff+とその姉妹指標に見られる変化は、より懸念すべきものである。Stuff+はERAと強い関係を持っています...同じチームに2シーズン在籍した投手だけを対象とする限りは。もし、予測されるERAが、主に投手本来の「スタッフ」によるものであるならば、このようなことは起こらないはずです。チーム移籍者の厳しいテストに切り替えると、Stuff+はFIPよりも悪いERAの予測因子となる。

Location+は、予測力に独自の変化がある。Location+は、球団を移籍した投手にはかなりの予測力を発揮するが、球団に残留した投手には全く役に立たないという評価である。現在所属しているチームであれ、入団した他のチームであれ、ロケーションはすべての投手にとって重要です。ストライクゾーンを見つけられない投手は、新しいチームでも古いチームでも、職を失うことになるのです。

表3では、これらの指標に対する強い信頼性の評価も、ここに関連している。これらの評価から、Stuff+とその関連メトリクスは、一貫して同じ選手に同様の評価を与えており、クラス最高のERA推定値よりも高い程度にそうしていることがわかります。(これは、Stuff+が投球結果よりも投球特性に重点を置いていることから予想されることです)。つまり、問題はStuff+がこれらの選手を変化したと見ているのではなく、彼らが他のチームに行った瞬間にERAが予測できなくなることを除けば、同じ選手として評価されていることです。

表4の様々なコホートの中で、チーム・スイッチャーの評価は「正しい」もののように思われる。これらのスコアは、投球位置を特定することが、投球の本来の質よりも将来のERAに関係することを示唆し(これは理にかなっている)、逆に、投球位置を特定できなければ、投球の質は失点防止にあまり関係ないことを示唆する。これもまた理にかなっている。ウェイド・マイリーが10年以上にわたって活躍する一方で、コントロールの悪い火炎放射器が現れては消えていくのには理由がある。最後に、Pitching+がStuff+とLocation+のコンボとして設計されている限り、Stuff+とLocation+の中間のスコアも理にかなっています。

しかし、なぜこのような格差が全くないのでしょうか?1つの可能性は、サンプル数が少なく、これは単なるノイズであるということです。しかし、この差の大きさは大きく、他の評判の良い投球指標では同様の挙動を示すものはありません。サンプルもそれほど小さくはありません:少なくとも私たちのグループでは、複数のチームで投球した投手が231人、2021年と2022年のためにとどまった投手が342人います。数千人の投手ではありませんが、30人の投手でもないのです。この数百の順位相関を5,000個のブートストラップサンプルにしたところ、全体の平均相関の標準偏差は、チームに残った選手は0.05~0.06、離れた選手は0.06~0.07でした。つまり、表4の最も極端な相関関係の変化は、95パーセンタイルの信頼区間かその外にある。偶然の一致と言えるのだろうか。そうかもしれない。可能性は高いか?そうとも言えない。

ERAが、所属チームに残留した投手のERAを強く予測し、退団した投手のERAを低く予測する最も単純な理由は、その指標が投手自身ではなく、投手の所属チームとそのチームの走環境について追跡しているからであろう。実際、ERAが投手のシーズン後半をよく予測し、投手の来シーズンをあまり予測しないのは、このような理由からです:ERAは、投球される公園や投手の後ろにいる野手の質などに強く影響されるのです。ERAは、投げるパークと各投手の後ろにいる野手の質に強く影響されます。

しかし、なぜそのようなことが起こるのでしょうか?私の理解では、Stuff+やそのような指標は、ウィフやスタットキャストの打球計測のような抽象的なスキルに焦点を当てており、理論的にはこれらの問題に抵抗するはずで、実際、これらの問題に抵抗するはずだという信念のもとに選択されている。しかし、この数字はそれ自体を物語っており、説得力があります。さらに、もしStuff+がERAとこのような関係を示すのであれば、他のStuffメトリクスも同様の弱点を示す可能性がある。

私たちは、その答えのすべてを知っているわけではありませんが、何が起こっているのか、いくつかの仮説を立てているのです。

なぜなら、野球の他のイベントとは異なり、三振と四球は、三振なら3ストライク、四球なら4ボールというように、複数の投球結果を実現する必要があるからです。このため、私はこれらを複合打撃イベントと呼んでいます。xwOBAは、前述のように、まさにこの前提に立っています。DRxとcFIPは、これらの事象をさらにモデル化していますが、追加的な利益はやや控えめです。その結果、スタッフ指標は、NIPイベントに対してほとんど追加的な情報を提供することができず、より少ない情報を提供することに大きなリスクを伴う可能性があります。

そして、BIPの事象は、チームの戦略決定やチームが提供する野手の質から切り離すことがはるかに困難である。優れた守備を持つチームは、投手がプレーに入れるボールの性質についてあまり気にしないかもしれません。チームによって、特に特定の状況において異なる投球の組み合わせが好まれるでしょうし、スタフメトリクスは、いくつかの投球タイプを一貫して評価しやすいと感じるかもしれません。

2つ目は、1つ目のポイントにやや関連しますが、チームは投手の球種を相対的に調整することが多く、少なくともそれらの球種を使用する方法を調整します。おそらく、新しいチームには、どの球種をいつ使うかという「哲学」があるのでしょう。もちろん、投球は互いに影響し合うものですから、特に新しい哲学が投手にとって厳しいものであれば、少なくとも最初のうちは、連鎖的な影響を及ぼす可能性があります。

最後に、打球の質の指標として発射角と発射速度を用いることは、先に警告したように、投手が発射角と発射速度に全責任を負っているという仮定を立てることになる危険性があります。少なくとも、発射速度については、それが真実でないことが分かっています。発射速度を単独で見た場合、打者のアイデンティティは、投手のアイデンティティよりも、発射速度の分散の4~5倍を説明することができると言われています。もちろん、ここではチームメイトではなく対戦相手について話しており、対戦相手はある程度洗礼されます。しかし、同じチームの投手は、特に球団内で同じような打者の組み合わせに直面する傾向があり、他のチームやリーグに移籍した投手は、多少異なる組み合わせに直面する可能性があります。

これらの説明のどれをとっても、個別にも全体にも完全に納得できるものではありません。もちろん、Stuff+やその種のメトリクスは、ERAを予測するために使用されるべきではなく、その代わりに、投手の全体的な球質を記述するための十分な統計として機能するように満足すべきであり、それ自体が有用なものである、というのが一つの結論でしょう。しかし、アーセナルメトリクスと投手の成績の関連性をよりよく理解することも、非常に有用なことのように思われますし、このレビューは、コミュニティがそこに到達するためにまだ行くべき道があることを示唆しています。

この記事が気に入ったらサポートをしてみませんか?