【SABR】セイバー指標の解説 − FIP
鯖茶漬です。いつもお世話になっております。
前回は「主要打撃指標」として「wOBA」の解説を行いました。
ということで今回は「主要投球指標」として「FIP」の紹介。
□前書き
▼「投手の貢献」とは?
「セイバーメトリクスの主要な指標」として先に打撃評価「wOBA」を紹介したのには理由があります。それは「私自身が『FIP』を含む多くの投球指標を人に説明できるまで理解できていなかった」という点です。
そしてさらに問題なのは、セイバーメトリクスという概念が誕生してから今日まで、様々な研究が行われた中でも「投手の貢献はどのように評価するのが最適なのか?」という問いにはっきりとした答えが見つかっていない、ということです。
まずは導入として、過去に重視されていた指標をいくつか挙げ、その問題点を挙げてみます。
▼過去の投球評価の欠点
「どんな形でもチームの勝利に貢献するのが大事だ」と考えるのであれば「勝利数」を重視するべきでしょうか?一見シンプルで分かりやすい指標のように思えます。しかしこの指標は「味方の打線が何点獲ったのか」「守備の影響はどれほどあったのか」という「投手評価」とは別の外的要因に左右される、という問題を抱えています。
また「先発投手は5回を投げ切らなければ勝利投手の権利を得られない」「サヨナラ勝ちの場合は最後に登板した投手が勝利投手となる」といったルールも主観的な評価でしかなく、先発投手と救援投手の貢献を同一に見做すのも不自然です。
NPBのアンタッチャブルレコードともいえる「通算400勝」を達成した金田正一も、過去のインタビューで「もっと強い球団で投げていたら500勝も可能だった」と答えており、暗に「勝利数は投手評価には適していない」ということを認めています。余談にはなりますが、金田正一は「0-1での完投負けが最も多い投手」という珍記録も持っています。
「味方の得点に関わらず、点を獲られないことが大事」ならば「防御率」を重視するべきでしょうか?確かにこの指標は「勝利数」が抱える「投手以外の要因」に左右されない評価のように思えます。
MLBでは2018年にジェイコブ・デグロムが「10勝9敗、防御率1.70」という成績でサイ・ヤング賞を獲得。先発投手としては歴代最少の勝利数での受賞となり、勝利数という「結果」だけでなく「質」による評価に移行しつつある、と話題になりました。
しかし「防御率」も勝利数と同様「守備やルールの影響を受ける」という問題を抱えています。防御率を算出する上で必要な自責点は「失策」で出塁したランナーを無視しますし、裏を返せば「味方のファインプレー」によって防がれた失点も投手の貢献と見做します。「ルールの影響」として極端な例を挙げると「失策により守備イニングが長引いた為、その後の大量失点も自責点に記録されなかった」というケースも存在します。
「そうは言っても点を獲られないことが重要視されるべきだろう。優れた投手は安打や被本塁打を抑えることに長けていて、三振を多く奪い、ここ一番では狙って内野ゴロを打たせてピンチを凌げるものだ。」、こういった考えを持っている方は多いかと思います。しかし、こういった従来の常識はひとりのセイバーメトリシャンの研究によって否定されることになります。
セイバーメトリクス史上最大の功績ともいえる「BABIP」の発見です。
▼セイバー史上最大の発見「BABIP」
アメリカのセイバーメトリシャンであるボロス・マクラッケンがBaseball Prospectusに「How Much Control Do Hurlers Have? (意訳:投手はどれだけ制御能力を持っているか?)」と題した記事を投稿したのは2001年。
「この話をすると大抵『お前は気が狂っている』という反応をされる」「アーロン・セレが偽名で書いているんだろう、という批判もあった(アーロン・セレはキャリアを通じて被打率が高かった)」「とにかく批判する前に、少しだけ話を聞いてほしいんだ」という、まるで批判を前提とした導入から慎重に自身の研究の成果を世に送り出しました。
その内容は「投手の『インプレー打率(本塁打を除く、グラウンド内に飛んだ打球がヒットになる確率)』にはまるで年度間の相関が見られない」というものです。ヒットを防ぐことは投手の能力では左右できないのではないか、と。投手の能力でコントロールできるのは、インプレー以外の「被本塁打」「与四球」「奪三振」だけなのではないか、と。MLBの歴史に残る名投手、グレッグ・マダックスやペドロ・マルティネスらの名前を挙げ、彼らについても同様だったとした上で「なぜそうなっているのか具体的に説明はできないが、私が知っているのはそれが事実だということだ」という文で締めくくっています。
従来の常識からすると極端な考えであり、当初は一般のファンのみならず多くの研究者からも批判の対象になったとされています。セイバーメトリクスの雄ビル・ジェームズですら当初は懐疑的でした。しかし、もし仮にマクラッケンの「BABIP(インプレー打率)は投手で制御できない」「被本塁打・与四球・奪三振から投手の能力を測れる」という説が正しいのならば、今まで曖昧になっていた「チーム全体の守備のうちの『投手の責任範囲』」にひとつの目安が生まれたことになります。
この考えから「DIPS(Defense Independent Pitching Statistics)」という「守備の影響から完全に独立した投手の評価方法」が誕生し、後にトム・タンゴがDIPSの評価方法から派生した「FIP(Fielding Independent Pitching)」という指標を生み出しました。
□投球指標「FIP」の紹介
▼計算式と考え方
「守備の影響から完全に独立した評価方法」とは一体どういうことなのか?DIPSの考えからは今も多くの指標が生み出されていますが、その中の代表としてまずは「FIP」の計算式を紹介します。
上の式から分かるように、FIPは「投手の能力のみを反映している」とされる「被本塁打・与四球(+与死球)・奪三振」のみで構成された失点をイニング数で割る、という大胆な算出方法です。防御率が「自責点×9÷投球回」という式により「9イニングあたりどれだけの自責点を失ったか」を算出していることから、FIPは「擬似防御率」という表現をしてもあながち間違いではないかと思います。
また、式の最後に「FIP定数」と呼ばれる数値を足しています。これは「リーグ全体の被本塁打・与四死球・奪三振」で算出した平均の数値を「リーグ全体の防御率」に合わせるものであり、考え方としては前回紹介したwOBAの「wOBAScale」に近いものです。wOBAScale同様にFIP定数もシーズン毎に細かく変化していて、その数値は「Fangraphs」→「Seasonal Constants」で確認できます。
大雑把な考え方としては「投手の能力を強く反映する指標のみで構成された『擬似防御率』」というところでしょうか。ここからもう少しFIPについて掘り下げてみます。
▼各係数の算出方法
ただ式を覚えるだけでも「理屈」までは理解できません。まずはFIPの式における「被本塁打=13、与四死球=3、奪三振=2」という係数が持つ意味について考えてみます。
FIPの各係数を算出するにあたり、打撃指標「wOBA」でも扱った「各イベントの得点価値」が適応されます。FIPを構成する「本塁打・四死球・三振」と、これら3つのイベント以外となる「BIP(Ball In Play)」の得点価値は以下。
上の数字を使って順に説明します。
①FIPを構成する3つのイベントをそれぞれ「BIPに対する得点価値」に修正する為、各イベントの得点価値に0.04を足す。
②9イニングあたりの失点数に換算する為、各得点価値を9倍する。
③小数点以下を四捨五入。
④投球回数で割る。
⑤FIP定数を加算する(後ほど説明します)。
④と⑤の部分は、防御率を算出する際に「自責点×9÷投球回数」とすることで「9イニングあたりの自責点を表している」という過程と同じ理屈です。①〜③の計算過程を再び表に示します。
イベント毎の係数は以上の過程で算出されています。ここに④と⑤の計算を追加することで、上に載せたFIPの計算式が完成します。
▼FIP定数の意味するもの
細かい部分ですが「FIP定数を足して防御率ベースにする」とはどういう理屈なのかを考えてみます。FIP定数の算出方法は以下。
XのフォロワーであるHEGEL氏のnoteが非常に参考になるので、そちらを紹介します。
簡単に説明すると「BIPの結果は投手の能力で左右しづらい部分である為、どの投手もBIPによって一定の失点が生まれる」という仮定を数値化したものが「FIP定数」です。
ネットでFIPの解説記事を探すと「インプレーの打球を無視し、被本塁打・与四死球・奪三振のみで評価する」という内容が多く見られます。大きく間違っているという訳ではないですが、考え方としては「全投手のBIPを一律のものであると仮定し、そこからの増減でFIPを算出する」という表現の方が的確だと思います。
また「完全試合」を例に、FIP定数が意味するものをなるべく分かりやすいものにしたツイートを私がしてますので以下に載せておきます。
ここでは深く触れませんが、HEGEL氏は「三振を多く奪える投手はBIPの機会も減る為、FIPは好投手(三振を多く奪える投手)を過小評価しているのではないか?」等の問題点も挙げています。各指摘を検証する内容になっているので、気になる方は一読することを強くお勧めします。
▼「投手fWAR」の算出方法
日本語の文献があまり見当たらない「WARの算出」の紹介です。公表はされていますが、稀に「WARの算出方法は公表されていないから信用できない」という意見を目にすることがあるのでリンクを載せておきます。
fWARについてはFangraphsを開けば瞬時に調べられますが、指標の理屈を理解する為にも一度自力で計算してみると新しい発見があったりします。また、fWARでは「内野フライは高確率でアウトになる」という統計を踏まえ「内野フライ(IFFB)を奪三振と同様に扱っている」という点が特徴です。また、内野フライを含めたFIPは「ifFIP」と呼ばれています。
記事の趣旨から外れてしまう為ここでは紹介程度に留めていきます。基本的には野手評価と同じく「リーグ平均からの差」「リプレイスメント・レベルからの差」「パークファクター補正」などから算出を行い、「先発」「救援」といった起用方法の違いも考慮できるようになっています。気になる方も多いと思うので実際の算出過程はまた別の記事で投稿します。
□「FIP」から派生した投球指標
▼「FIP-」で相対的に評価する
FIP-は各選手のFIPをリーグ平均からの相対評価にする指標です。wOBAをwRC+に変換するのと理屈は同じで、年度の異なる数字もこの指標によって比較すすることが可能になります。100を基準とし、下回るほどリーグ平均より優れていることを示します。
2022年、2023年からそれぞれ同じFIP-を記録した2名を例に挙げました。FIPのみの比較だとスネルが0.4ほど悪い数字になっていますが、前年と比較して大幅に得点が増加した2023年の中で比較すると、傑出度はウェブと同等であることが分かります。
簡易的ではありますが「野球は相対評価のスポーツ」であることから、各指標の傑出度を比較することは個人的に大切だと思うので紹介しました。また、FIPに限らず打率や防御率といった指標もすべて「+Stats」としてFangraphsで確認することができます。
▼HR/FBを加味した「xFIP」
xFIPは「外野フライは一定の割合で本塁打になる」という統計データを元に開発された指標です。FIPは「打球のランダム性」を考慮し、対象を本塁打に絞って計算されます。xFIPはさらに「本塁打のランダム性」も排除することで、より投手の実力を測ろうとします。
スタットキャストが導入された2015年以降の上昇が著しいことが分かります。「すべての投手がリーグ平均と同じ割合で本塁打を浴びる」という仮定の指標である為、FIPと比較してxFIPが優れる投手は「打球のランダム性によるブレから、平均よりも多く本塁打を浴びた可能性がある」ということが分かります。
2023年シーズン、規定投球回到達者の中でトップのFIPを記録したグレイの成績です。被本塁打、四死球、奪三振で算出したFIPではトップであった一方、外野フライの本数を考慮したxFIPでは全体16位となっています。これはリーグ平均を大きく下回るHR/FBが大きく関係していて、グレイはこの指標においても全体1位でした。
ただ、キャリア通算のHR/FBは11.5%であり、グレイが他選手よりも被本塁打を抑えられる投手とは言い切れません。xFIPはこういった偶然の要素も考慮する仕組みになっています。
▼打球を細分化する「tRA」
FIPは「BIP(本塁打以外の打球すべて)」に同等の重みづけを行い、それ以外の「本塁打、四死球、三振」にそれぞれ係数を与えることで投手の能力を測る指標でした。tRAはさらにBIPを細分化し、「内野ゴロ、内野フライ、外野フライ、ライナー」とそれぞれの打球に係数を与えて算出を行います。
前述したように、BABIPの原理から「投手は打球をコントロールできない」という考えを派生させて誕生したのがFIPです。その一方、選手によってはキャリアを通じて「GB%(被打球におけるゴロの割合)が高い」というような傾向があるのも事実です。
打球ごとに分類してみると、xFIPの項で説明した通りフライは一定の割合で本塁打になる傾向があったり、ゴロの打球の得点価値はフライと比較してわずかなものであることも判明していたりと、それぞれに特徴があるのが分かります。tRAは「打球の種類」までを投手の責任範囲に定め、結果を説明しようとする指標です。
日本の野球データ会社である株式会社DELTAでは、投手WARの算出にtRAを用いています。Fangraphsは「被本塁打、与四死球、奪三振のみ」を、Baseball Referenceは「すべての失点(厳密には守備や球場の影響を除いていますが)」を投手の責任範囲と定めていることから、DELTA社はこの中間(のfWAR寄り)で投手評価をしていることが分かります。
個人的に「BIPをすべて一律に評価するのは極端すぎるのでは」と考えているのでtRAの評価方法はかなり好みです。FangraphsがFIPをWARのコンポーネントに使用しているのはそれが最善だと考えているからなのでしょうが…。
冒頭で述べたように、ここまでデータが発展した現代でも投手の評価方法は様々です。DIPSの考えのように「どこまでを投手の責任範囲とするか」という問題への提案としてtRAを紹介させていただきました。
□終わりに
▼余談:マネーボールでのDIPSの扱い
私が最初に「DIPS」の考えに興味を持ったのは、書籍版「マネー・ボール」におけるチャド・ブラッドフォード(元アスレチックス他)の登場シーンでした。
独特なフォームから135〜140km/hの直球を投げ込むスタイルは、当時他球団からまったく評価されませんでした。しかし、一足早くセイバーメトリクス的評価を、そして「DIPS」を導入したアスレチックスがその才能を見出し、ブラッドフォードを中継ぎのエースとして起用していく、というものです。
BABIPを発見をしたマクラッケンは、当時メジャーとマイナーの行き来を繰り返していたブラッドフォードの才能をいち早く見抜いていたとされています。その一方、各球団の首脳陣をはじめ多くの関係者は「変わったフォームであるから」「被安打が多いから」といった「従来から存在していた評価方法」によって、ブラッドフォードを過小評価していました。
ブラッドフォードは当時から「極端にGB%(ゴロの割合)が高い」「BABIPが高い」「制球力があり、被本塁打は少ない」という特徴がありました。これらをセイバーメトリクス的な評価に当てはめると「好投手に必要な要素は備わっており、防御率が悪いのは得点価値の低いゴロの打球が『たまたま』安打になっている可能性が高い」と言えるでしょう。
私はこのエピソードを通じて「選手がより正しい評価を受けたこと」と「野球の知られざる構造の発見」の2点に感銘を受けたことを覚えています。これらはすべてマクラッケンの研究から発展したものです。仮に新たな発見があったとしても、それを現場の野球関係者が素直に受け入れることは簡単ではありません。投手の「真の実力を測ろうとする試み」は、当時少数派であった「野球の構造をより理解しようとした人たち」の貢献の上で成り立っているのだとつくづく感じます。
▼「BABIP」とこれからの投球評価
セイバーメトリクスを代表する指標、考え方として「DIPS」ならびに「FIP」を紹介しました。また前回の「wOBA」と合わせて、タンゴはXで「野球ファンが覚えておくべき指標はなにか?」の問いに対して「打撃=wOBA、投球=FIP、守備=OAA」の3つを挙げています。
その一方で、タンゴは自身のブログで「WARの改善」と題し、いくつかの投手評価方法を提示しています。
そして、上記5つの評価方法をそれぞれ9イニングでの失点率ベースに変換した上で「それらの平均を取って評価することをお勧めする」とのコメントを残しています。一見雑な評価方法にも思えますが、現状どの評価方法も一長一短である為、それらの平均を取るくらいがいいんじゃないか、と。
しつこいようですが、何が言いたいかというとそれほど投手の評価は難しいということです。打球のランダム性、球場の地形、味方の守備、相手の打線…。実際のゲームでも「四球→本塁打」では2失点となりますが、順序が逆だと1失点としてカウントされます。これを偶然と割り切るのか、投手の能力だと言い切れるのか。
考慮しなければいけない要素はたくさんありますが、これらの議論はすべてマクラッケンの「BABIPの発見」から始まったと思っています。今までは「投手の能力」だと考えられていたものが、実は運によるものである可能性が高い。じゃあその「運」の程度はどこまでなのか?それはどの程度のサンプル数を指すのか?例外となる投手はどのような特徴を持っているのか?
従来の評価方法をリセットしなければいけないほどの大発見ですが、それは野球界にとっても素晴らしいことだと思います。不運が続いたことにより「勝敗、防御率」で不当な評価を受けていた投手がしっかりと評価される。選手にとっても球団にとっても大切なことです。しかし、これらの評価方法も「現状ベターと思われるもの」でしかないのも事実です。
スタットキャストの導入により野球は目覚ましい速度で発展していますが、実は2000年以降からも毎年BABIPの数値は.290〜.300前後に収まっています。つまり能力が向上しようとも「ある程度のランダム性に左右され、投手の能力では防ぎきれない部分がある」ということです。
これからの投手評価は「BABIPのランダム性」を前提とした上で「被打球の傾向」の部分に焦点が当たっていくと予想します。奪三振能力に長けた投手は運の要素に左右されない為優れた投手である可能性が高い。その一方で各打球にはそれぞれの価値があり、被打球の種類には年度ごとの相関があることも判明しています。
個人的な分析としても、スタットキャストのデータを中心に「どういった投球・球種がより被打球を抑えられるのか?」という点に注目していくつもりです。投球評価はまだまだ発展途上だと言えます。興味のある方はBaseball Savantを開いて、より高度な評価方法を編み出してみてはいかがでしょうか。その分析がもしかしたら、野球界のさらなる発展に繋がるかもしれません。
※他の参考文献
※ヘッダー画像は「https://www.twinkietown.com/2023/11/6/23943742/mlb-offseason-questions-twins-re-sign-sonny-gray-contract-amount-structure」を引用。
※全ての商用的、あるいは著作権侵害の意図を放棄して投稿します。
この記事が気に入ったらサポートをしてみませんか?