「タックルの上手さ」が分かる指標を作ろう!【NFLリサーチ紹介#8】
オフシーズン、NFL的にはかなり暇ですね。ニュースがないとはいえ都知事選と大統領選でTLが埋まるのは勘弁して欲しい。Netflixに大分助けられています。「Receiver」は見てる方多いと思いますが、「America’s Sweetheart: Dallas Cowboys Cheerleaders」も良かったですよ。特に最終回。
1. NFL Big Data Bowl
そんな関連番組も全て見てしまった、推しチームの情報も流れてこない、だけどNFLに触れたい…というあなたにおすすめなのが、次のNFL Big Data Bowlというデータコンペです。
僕はNFLの論文を読むのが好きという変わった趣味(参考記事)があるのですが、多くのNFL系の論文の難点として、(1) 査読に時間がかかるのでデータが古い (2) PFRなどで公開されている簡単なデータしか使えない (3) 論文へのアクセスが大学に所属していないとない(ので転載すると著作権違反)、という欠点があります。その点、Big Data Bowlは「最新のデータ、高度なデータを使って研究する(今回は2022のWeek1-9のデータが参加者に配られました)、結果は全て一般公開」ということで、内容がより現在のNFLに近く、面白いものが多く、皆さんに共有もしやすい。
そこで今回は、2024年の最優秀賞を取ったチームの研究「Uncovering Missed Tackle Opportunities(見逃されたタックル機会を発見する)」を紹介してみたいと思います。
2. ラインバッカー(LB)はどうやって評価するか?
さて、今年のテーマの「タックル・パフォーマンスを検証する」という内容は非常に良いお題(毎年いいお題ですが)。何しろ現状のNFLには、タックルの上手さを評価するスタッツがありません。僕はFred Warner (SF)がダントツでリーグ最高のILBだと信じていますが、それをスタッツで証明するのは非常に難しい。
LBの主要なスタッツはタックル数しかないですが、タックル数は多ければ多いほどいい選手という指標ではありません(弱い選手や守備で逆に増えることも)、また、実はかなり主観的な指標です(どれがソロタックルなのか等は記録員が見て判断)。しかし他の1st team all-pro(APの記者投票)や、PFF grade(PFFのメンバーがプレーの動画を見て点数化して判断)といった指標も個人の判断で決まるものなので、何か客観的な指標が欲しい。
個人的にはPFFは課金していますし、グレードにも価値はあると思いますが、全く完璧だとは思っていなくて、PFFグレードが守備選手を表す一番良い指標のように扱われている現状には結構な違和感があります。今回のお題設定の背景として、「タックルの上手さ」というこれまで主観的にしか測れなかった指標をデータから導けるようになれば、選手をより客観的に評価できるようになり価値があるというのは少なからずあるでしょう。
3. 今回の研究
3.1. 選手の位置や速度データから、各時点の「タックル成功率」を調べた
そこで今回の優勝チーム(調べてみたら凄まじいエリート集団でした)は、機械学習を使って「次の1秒間でタックルが成功する確率」を計算するモデルを作成しました。
今回は、Week1〜Week8で8000の成功タックルと1583のミスタックルのデータを分析してモデルを作成し、作成したモデルをWeek9のデータで検証したところ、非常に高い予想精度でタックルの成功率を判断できることを示しました。
このモデルの素晴らしいところは、入力データ(距離、速度、選手の位置など)が全て客観的で、主観が入る余地が1つもありません。試合の録画データから人間なしでそのままタックル成功率を計算できるわけです。
3.2. 時間変化をプロットすると、ミスタックルのタイミングが分かる
このモデルで計算するタックル成功率は、時間変化によって変化します(選手の位置、距離、速度が変わる)。これをプロットしてみると次図のようになります。
プレー開始4秒付近に注目してください。ここではタックル成功率がほぼ100%に近いところまで上がったのに、その後下がっています。これが「ミスタックル(タックル成功率が高いのにタックルできずに逃した)」だと考えることができます(今回の研究では、著者は「75%以上のタックル成功率が0.5秒以上続いたが取り逃がした」のを「ミスタックル」と定義しています)。
つまり、録画データを機械に入力してタックル成功率を時間別に計算するだけで、「どこでどのディフェンダーがミスタックルした」というのを自動検出できるということです。繰り返しになりますが、ここまで人間の作業が一切要らないのがすごい。
3.3. 具体的なプレー(TB-LAR, NO-BAL)で見てみよう
まだ分かりにくいということで、研究では具体例を挙げてくれています。
1つ目は2022年Week9のTB-LAR。割と普通のプレーですが、TBのRBのLeonard Fournetteが左へのランでAaron Donaldをかわして、Jalen Ramseyと接触後に最後はErnest Jonesが追いついて倒された(6ヤード獲得)というプレー。
これをプロットすると上図のようになります。確かに、最初タックルをかわされたDonald(緑)のミスタックルが1.5秒に観測され、次にRamsey(オレンジ)が追いつき、動きを止めている間に青のJonesがタックルに成功して止まった、というのがグラフを見るだけで分かります。(RamseyもJonesもミスタックルしていないのは、タックル成功率がこの後下がっていないことで分かる)
2つ目は2022年Week9のNO-BAL。こちらは動画付きで、BALのKenyon Drakeが大量にタックルをかわしながら18ヤード獲得したプレー。グラフのようにTaylor (紫), Ellis (緑), Roach(赤)とBaun(青)、という順に山があってミスタックルが分かります。ファンとしては見ていて辛い。
ちなみにPFFのスタッツ上だと、Malcolm Roach (#97)だけミスタックルがついています(1試合で何百プレーも見て記録する人間の限界)。この方法なら、自動的に4人タックル失敗した選手を検出してくれて、また各々の責任の割合とかも計算できるわけです。
3.4. やっぱり Fred WarnerがNo.1
著者はさらにこれを応用して、2022のWeek1-9でLB, S, CBの選手別に
指標1. タックル機会率 = タックル機会があったプレー数 / アクティブなプレー数 (どれくらい試合においてタックルする機会が大きいかの指標)
指標2. ミスタックル率 = タックル失敗したプレー数 / タックル機会があったプレー数 (どれくらいタックルミスが多いかの指標)
という2つの指標を提案し計算しています。人力でやるには多すぎる集計ですが、今回は自動集計なので全選手のタックル機会とタックル成功/失敗数が計算できます。これをポジション別にプロットする(指標1がポジションでズレがあるため)と次図です。
このように図示すると、「右下 (ボールにはめちゃくちゃ絡むが、タックルミスは少ない)=タックルが上手い」と判断できると著者は提案しています。
ここで非常に説得力があるのが、右下に来ている選手のメンツですね。LBではFred Warner (SF)とNick Bolton (KC)、SではDerwin James (LAC)にBudda Baker(ARI)。プロボウル級が並んでいます。またJonathan Owens (GB)やAlex Singleton (DEN)に関しても、タックル技術が高いのだろうと想像できます(あまり詳しくないですが、パスカバーがイマイチなのかも)。
ちなみに本文中にはないですが、オフェンス選手で同様に調べると、最もミスタックルを引き起こす選手はLamar Jackson (BAL)らしい。やっぱり正確そうなモデルですね。
3.5. 結論
まとめると、試合の録画データから適切なパラメータを設定して精密なモデルを作成することで
現在は公式の記録ではない「ミスタックル」を客観的に自動検出できる
これを使って、現在のスタッツだけでは分からない「タックルが上手い選手」を評価にも応用できる
というのが新しい点でした。
4. 感想:PFFの限界は、ビッグプレーに引きずられやすいところ?
最後に、これは研究内に書いてあったわけではないですが、1つ思ったことを付け加えます。今回一番驚いたのが、先ほどの図のデータで、Frankie Luvu (CARのLB)がミスタックル率で圧倒的に上位にいる点(ミスが4割超え)でした。これ、同地区のNOを応援している自分としては結構意外で、Luvuはいい選手のイメージでした。Off-ball LBなのに毎回凄いスピードでRBやQBに突っ込んできてサックやFFを量産するイメージで天敵。今年3年$36MでWASと契約しましたが、別地区に行って本当に嬉しいくらい、めちゃくちゃ優秀な選手のイメージでした。
ところが、今回の結果ではタックルの「精度」が低いという事実が明らかに。実際調べてみると、詳しい人だけがこのモデルと同様に、「凄まじいスピードのタックルは諸刃の剣で、ミスタックルが多い」ことを指摘しています。推しチームの選手でもない限り、LBで見るのなんてビッグプレーとせいぜいPFFグレード程度(実際PFFグレードはビッグプレーに引きずられているのか非常に高くなっています)。
今回のモデルでは、Fred Warnerが良いLBという試合見ていれば分かる話が再確認されるのに加えて、Alex SingletonやJonathan Owensが実は超優秀なタックラーだとか、Franklie Luvuは実は大きな欠点があるとか、目に見えづらい点がわかるという点でもとても価値があると思いました。優勝も納得ですね。
5. 次回予告(?)
次回予告、と銘打って書かない記事が多いのは置いておいて、実はNFL Data Bowlは6年目で、毎年面白いテーマが設定されています。
2023「パスプレーにおけるラインマン(OL, DL)の評価」
2022「スペシャルチームのパフォーマンスの評価」
2021「パスに対するディフェンススキームをデータサイエンスで理解」
2020「ハンドオフ時点でラン獲得ヤードを予測するモデルを作れ」
2019「パスルートとオフェンススキーム」
今回紹介した2024も、優勝チーム以外の研究も面白かったですし、2023のラインマンも(若干難しいですが)意義が大きいと感じました。また、実はファイナリストに日本の人(メルカリのデータサイエンティスト)を見つけたりもしました。
今回の記事で反応が良さそうなら、続いてBig Data Bowlシリーズをやってみたいと思います。長文記事、お読みいただいてありがとうございました。よければ他のものもお読みください。
6. 余談
今回の優勝チームはどんな人がやってるんだろうと思って調べてみたら、なんとスポーツ関連の人ではなく、プリンストン大で博士を取ったデータサイエンティスト4人の友人同士で応募したそうです(所属はmetaだったり元Appleだったり大学教授だったり)。優勝した人のブログを読んだのですが、アナリティクス詳しいと陥りがちなデータ至上主義にならず、実際のプレーや聴衆の感想をリスペクトした上でデータサイエンスを行っているのが素晴らしいなと思いました。ちなみにリーダーは49ersファンだそうです。
7. 出典
優勝チームの発表(図は全てここから)
動画で発表も見られます
勝者発表と報告記事