prospect week primer

要約版

まず、分布、20-80scale、将来価値について説明。
prospect評価pointは、ある選手がMajor Leagueで playする可能性を持っているか。もし「YES」なら、どの程度のmajor leaguerになるか特定が重要。
Wins Above Replacementは、誤差の範囲だが、major leaguer評価に最も一般受けしやすい指標。
選手を区別するかなり粒度の高い方法を与えるので、そのmetricにprospectの予測をmapするために便利。
WARはより正確にちょうどどう良い理解するのに役立ち、才能とperformance spectre上の全選手の間に存在する日光を示す。

野球の才能は母集団全体に正規分布。
major leaguerに限れば、右端にトラウト、真ん中にImpactが弱く careerの長い選手、左端にcareerを積んだ「coffee cup」typeというBell curveの形状を保つ。登場したのが「20-80 scale」だ。この尺度は、野球界(様々な科学分野)で古くから使われていて、ある選手が連続体のどこに属しているかを伝える手軽な手段として使われている。この尺度を使うと、「50」が平均で、「50」の両側の「10」刻みが平均から離れた標準偏差を表します。この尺度が0から100までないのは、dataの圧倒的多数が平均の両側3つの標準偏差の中に存在し、その偏差の外に存在するdataはnoiseとみなされるから。もし身長をgraphにするとしたら、ジョエル・エンビードとヤオ・ミンは、ヤオがエンビードより5〜6inch高いにも関わらず、共に80となるだろう。7ftの選手は6 ftの平均から3標準偏差離れているため、ヤオや他の選手の身長はnoiseとなっている。

打者のWARを20-80のscaleにmappingすると、このようになる。

小数点以下の数字に惑わされて、完全に正確だと思わないで。これらのWAR bandは、実際の大リーグの標準偏差に基づいているが、bucket間線は、このgraphほど厳密ではない。ここで重要なのは、曲線の上端に位置する成績は稀。正規分布では、平均より2つ以上の標準偏差が存在するのは母集団の約2%だから、約800人の選手集団の中で、「70台」「80台」となるのは10〜15人程度。

問題は、amateurやminor leagueにはWARが存在しない(理由は明白だが)。そのため、Major LeagueのWAR生産量を予想必要。そこで、Major Leagueで活躍する現役のMajor leaguerを指標。視覚的なscoutingと関連dataの組み合わせにより、skillとtoolを20-80の尺度で評価し、どのような選手かを見る。

ハビエル・バエスはelite batspeedの持ち主だ。パワーを評価する視覚的、データ的手段は、21歳ではそうではなかったが、現在は70だ。そのため、「憧れの存在」は間違いないだろう。バエスのcareerとWAR outputは、prospect versionのボ・ビシェットを評価するtemplateを提供してくれる。この段落全体にボーの名前をMadLibしても、彼とバエスは非常に似た攻撃的な才能を持っているので、うまくいくだろう。つまり、バエスのWARをBichetteの予測にJump off pointとして使用できる。しかし、そのような事はない。

バエスのPeek年(2018年の5.4WAR)はscale上70だが、毎年そうではなく、多くの seasonが2.5~3.0WARの範囲に留まっている。バエスやカルロス・ゴメスのように毎年5前後のWARを出す選手がいる一方で、バエスやゴメスは少しの間Peekがあったに過ぎないので、バエスを「70」と呼ぶのは正しくないだろう。複数年のsampleの平均を使う方が、本当の能力や影響をより正確に理解できる。そのsampleは何年分であるべきか、理由は?そこで、free agent前の6 seasonのWARに20-80尺度を対応させたFuture Valueが登場する。

なぜ6年?バエスの例が示すように、複数年予測は、おそらく単一seasonのPeekよりも有用。しかし、ある種の上限がなければ、本質的にcareer WARを投影する。ジョアキム・ソリアやネルソン・クルーズのように、永遠に playし続ける選手もいて、厄介。しかし、10代や20代前半の選手に、ソリアやクルスのように長く playする選手を予測するのは愚かで、特に長く playする選手はfree agentで移籍する傾向がある。逆に、28歳のfree agentを評価する時、チームは "この男は21歳の有望株としてどうだったのか?"と自問する事はない。彼らはより最近の評価を気にする。つまり、FanGraphsでprospectの未来を予測しようとする時、目先の未来つまりデビューしてからその能力を発揮してFree Marketを享受できるまでの期間を予測しようとしている。

バエスの話に戻ろう。free agentまでの6年間で、彼は17.5 WAR年平均WAR3弱を稼ぎ出した。つまり、バエスと全く同じようなcareerを歩むprospectがいたら、60FV。一般的に、選手につける将来価値は、free agent前のTeam controlの年に年平均WAR(20-80scaleでmapping)がどうなると思うかで決まる。free agentまで十分なcareerを持つ大リーガーであれば、全知全能のprospect writerが予想したFVを算出できるはず。
マーク・レイノルズがfree agentまでに積み上げたWARは9.2年平均1.5で、FVは45。セザール・エルナンデスは?年平均WARが2.25程度で、FV50に相当。

50FVは、その選手が与えられたpositionで毎日活躍するBig leagerになると考えている事を示す。50以上は、そのprospectがどの程度のregularになるかをより正確に示しており(先ほどのトラウトとハーパーの比較を思い出す)、一方50以下のgradeは、scaleの底に近いRoll playerとレギュラーを記述する傾向がある。Roll playerのsample sizeは小さくなる傾向があり、WARは play時間の影響を受ける累積的統計であるため、これらの選手の成績はWARに少し正確に対応しない。一塁手には多くのsluggerがいるため、一塁手として50を取るのは非常に難しい。例えば、ヘスス・アギラー。彼はAll-star teamに出場し、3WARのseasonを1度経験しているが、一塁の攻撃のhurdleは非常に高く、1WARあたりをうろつく方が多く、2014年のデビュー以来、5.2WARを積み重ねている。これは40だ。それはアギラー (のようなprospect) を40と呼ぶに失礼ではない、それだけで野球の才能の連続体の彼らの場所の文脈。WAR/FV chartをもう一度見てみよう、役割の説明 (とPlatonicな理想) を除いて含まれている。

plusは何か?即戦力になりそうな選手には、chartが示す役割に対応するもの。若手選手には、その選手がブレイクし、更に上位に行く可能性がある事を示すもの。通用するFV45や50の選手と、あるinternational classの最もbonusの高いprospectを交換するか?もし、毎回そのような取引をしていたら、結果はまちまちでしょう。優秀な大リーガーと偉大な選手になる見込みのある選手を交換になるでしょうが、優秀な大リーガーと全く成功しない見込みのある選手を交換する事にもなるでしょう。そのTradeが賢明だと思うかどうかは、チームの競争力の位置づけによるかもしれませんし、そうであれば、例え片方の天井が確実に高いとしても、問題の選手のFVが同程度であれば、どうするかを決めるのに参考。選手の序列にこだわらず、評価に集中できる優遇策を講じる事ができる場合が多い。特に若い選手は、「+」は将来的にFVが高くなると思われる、つまり継続的に成長できる要素がある事を示す傾向。

時間とriskもfuture valueに組み込まれるため、この概念にはもっと微妙なnuanceがある。もし、同じように予想される2人の選手がいて、1人がAAAにいて、もう1人が高校にいたら、AAAにいる選手は常にprep starより上位にrankされ、おそらくFVも高くなる。もし選手が怪我がちであったり、scout筋などの目から見て故障riskを高めるような特徴を持っていれば、その選手のFVを薄める傾向がある。このような選手を予測する事は、ハリケーンの進路を予測するようなもの。ハリケーンの現在地から離れれば離れるほど、その進路のerrorbarは広くなる。これを「Variance」と表現する事が多いが、これはBig leaguerの年ごとの成績の変動(バエスはVariance60と高く、エルナンデスはVariance50と低い)に当てはまると同時に、若手有望株のvolatilityを表す。トニー・サンチェスは低変動率のdraft候補だったが、トラウトは高変動率だった。未知のものには価値がある。未知のものがプラスに転じるかもしれないのだから。

特に若い投手は、draftで指名されてから大リーグに定着するまでの約4、5年間、週に一度、肘がロシアンルーレットになる。この半世紀で投手の役割は大きく変化。怪我や消耗のため、チームは seasonを乗り切るために開幕roster以上の投手を必要とする傾向があり、spot先発や上下リリーフタイプの投手のニーズが非常に大きいため、prospect listの下位を多くの投手が占める傾向がある。怪我をした時にトリプルAから呼ばれる先発1、2番手として長いcareerを持つ投手はprospect listに載せるには十分な価値がある。反面、総合TOP100を含むprospect listの最上位は、打者が密集している傾向がある。- 我々 はあまりにも多くの回ストーブに手を入れているこの分野で調整を行うためではないです。大リーグへの近さも、特に先発投手などをどう並べるかに影響する変数。一方、リリーフ陣はイニング数が少ないため、WARによる評価では不利。私たちは、リリーフのFVの方法を、単にWARの出力に対応させるのではなく、もう少し主観的になるように調整した。これは、先発とリリーフのWARをWARそのものではなく、FVでfilteringする事の利点の1つで、このように手動調整が可能。ここでは、投手WARを20-80の尺度にmappingし、FVによるリリーバーの役割も併せて示している(以下の表では「+」の指定も利用している事に注意)。

これは、近い将来参照すべき、プロセス関連の入門書のかなり大きな塊である。昨年秋のこの記事には、私たちが常時数千のprospectに首尾一貫した tool gradeを付けるという問題にどのように対処しているかについての詳細が書かれている。
また、他のprospect出版物も、20-80scaleを使う事が多いとはいえ、全く同じ方法でprospectを行っているわけではないにも注意。

この記事が気に入ったらサポートをしてみませんか?