
バスケのデータ分析オンライン講座第2回 ~分析時に扱うデータ~
こんにちは。
アメリカのバスケのデータ分析オンライン講座について、前回は第1回の講義のまとめを行いました。
今回は第二回の内容の振り返りや感想を記載していこうと思います。
内容としては、バスケットボールで集めるデータについてとなります。
これまでにどのようなデータが生まれてきたか
データの種類と特徴
これまでに生まれてきたデータの種類やその特徴として下記の項目があります
ボックススコア
基本的なデータ。これを使うことで、試合で何が起こったかをクイックに要約・把握することができる。分析の取っ掛かりとして使えるデータ。
しかし、ネガティブな面として文脈を失っていることが挙げられる(誰が誰にアシストしたのかなど)
プレイバイプレイデータ
ボックスコアよりも深い分析が可能になっている。細かいアクションが時系列で記載され、その時に誰がいたのかも分かるので、ボックスコアより文脈を追うことができ、さらにプラスマイナス分析もできる。しかも、これは誰が見てもどんなアクションが起きたか分かるデータとなっている。
しかし、ネガティブな面として、いまだに欠落している文脈がある(すべてのパスや選手の位置など)
トラッキングデータ
空間と時間を追えるようになり、とても粒度の細かいデータが取れるので、ボックスコア・プレイバイプレイデータよりさらに深い分析ができる
一方で、取得するデータはあくまでボールや選手の位置を占めす座標であり(下記イメージ画像)、これを読むだけで何が起きたかを解釈することができない。そのため、このようなデータを扱える専門家が必要となる

また、トラッキングデータで行える分析や取り組みの例も紹介されました。
トラッキングデータの活用イメージ①
添付画像は、4Qのラストポゼッションでオフェンス側が1点負けていて、ロンゾ・ボールがドライブしてリム近くまで侵入したシチュエーションになります。
このときロンゾは自分含め誰にシュートを託すべきだったでしょうか?
ここでトラッキングデータ*1を使うことで、誰に託したらシュート成功率がどうなるかを予測することができます。
その結果として、ロンゾがそのまま打つ場合の成功率は44%、右上のイングラムにパスして打った場合は33%との予測結果になりました。
実際の場面ではイングラムにパスして勝利しましたが、データからは自分で打つべきだったと予想されています。
これらのデータを適切に共有することで、ロンゾがより良い判断をできるようになるはずで、こういったアプローチがトラッキングデータを活用する例として筆者は述べていました。

*1 この時点での位置だけでなく、DFの進行方向なども算出できるため、そういった種類のトラッキングデータも使って算出しているようです。
(イングラムの位置と正反対に向かっているなら、イングラムに出せばオープンになりやすいと予想できますからね)
トラッキングデータの活用イメージ②
トラッキングを使った分析や検証の例として、ウェストブルックが加入したレイカーズに関するチームフィットの検討を行っていました。
彼らはお互いにフィットしていないという風潮になっているが、実際はどうだったのかという問いに対して、オフェンス面で下記のような情報をまとめていました
レイカーズはオフェンス面でリーグ23位にランクしていた *2
レブロンとウェストブルックがコートにいるとき、53%のプレーはPnRだった
ウェストブルックはオフェンスの42%で主要なボールハンドラーだった
ウェストブルックのPnRの89%はレブロン以外とのもので、得点効率としては0.91 pts per playだった
レブロンとの場合は1.1pts per playだった
これらを見ると、ウェストブルックとレブロンのPnRを増やせばオフェンスのランキングも上がったと考えられる
実際、ウェストブルックとレブロンのPnRの映像を見ると、レブロンにレーンのスペースを与えることができていて、効果的なオフェンスということが分かる
この内容を伝えれば、彼らはその役割をもっと引き受けてくれたかもしれず、そう考えると彼らがフィットしていなかったとは安易に言えない
このデータを踏まえて、その上でフィットしていたかそうでないかを判断するのは個々人に委ねられると思います。
ただ、重要なことは、トラッキングデータを使うことで+ / -から更に深掘ったチームフィットの分析など、これまで出来なかった分析ができるということかなと個人的に考えています。
上記のような役割分担ができないなら結局フィットしていないという観点もあると思いますが、フィットしていないというのはどういうことなのかを解像度高く議論できる状態になるのもトラッキングデータのメリットかなと思います。
*2 どういう指標で23位かの明言はありませんでしたが、おそらくオフェンシブレーティングだと思われます
趣旨とは少しずれますが、トラッキングデータを使って本格的に分析をする際には、取得する項目の詳細定義や取得するまでの流れを把握する必要があると個人的に考えています。
例として、「レブロンとウェストブルックがコートにいるとき、53%のプレーはPnRだった」という情報に対して、53%の分母と分子は何なのか、PnRをどのように判定しているのかといった情報は、外からだとブラックボックスになっています。
例えば53%というのが、1ポゼッションの中でPnRを1回でも利用した割合なのか、最終的なフィニッシュに繋がるプレイがPnRだった割合なのかなどは不明瞭で、この内容によって結果の解釈は変わってくると考えられます。
ボックススコアやプレイバイプレイデータはそこらへんが比較的明瞭だと思うのですが、トラッキングデータは曖昧なので、必要があれば深く調べる必要はあるでしょう。
データサプライ企業が提供するツールについて
データサプライ企業が提供しているダッシュボードの一部も拝見させていただきました(企業名や実際の画面は非公表です)。
メインはPickに関するダッシュボードの共有で、下記の項目が詳細にまとまっていました。
全てのPickの回数やそこからの得点数
上記1をボールハンドラーとスクリナーが誰なのかで分解した場合の、それぞれでのPickの回数や得点数
(オーバーやスイッチなどDFの守り方などでの分解も可能)見たい組み合わせをクリックすることで、実際の映像を見ることができる機能
他にもいろいろなダッシュボードの例を見させていただきました。
ビジュアルとしてシンプルで、指標の定義を把握できていれば、選手やチームの特徴をスムーズに把握することができそうなツールとなっていて、とても面白そうなサービスでした。
実際のフィルムも交えた分析は必要ですが、とりあえず取っ掛かりとしてとても有用そうだなと感じています。対戦相手の分析をする時に回数が多くて、かつ得点効率も高い攻め方がすぐに特定できるので、そこからスムーズに深掘り分析に移行できそうです。
Pickの種類は機械学習で分類していて、学習用のデータとしてチーム関係者にラベリングしてもらったらしいです(これはiceでこれはunderでなど)
ただ、個人的にこのデータが本当に正しく分類されているのかは気になっています(例えばスペインピックなど)
とりこぼすくらいなら多少異なるのが入っていても網羅されてる方がいい気もしていますが、データの精度判定など、どのように運用しているのか知りたいなと思っています。
新しいデータを見つけることについて
ここでは、新しいデータを見つけることの必要性や具体例について述べられました。
まず前提としてNBAのデータは基本的にはチームスタッフなら誰でも使えるデータが多く、それで差をつけるのは難しいと述べています。
そして、分析を担当する人の力量で差がつくこともあるが、その可能性は低く、大きく差をつけるなら新しく使えるデータを定義・収集することが必要になるとも述べていました。
個人的な見解として、これは大なり小なりデータ活用が進んでいるNBAならではの状況かなと思っています。そもそもデータ活用をしていないチームが多いなら、先陣を切って活用するだけで差をつけたり or 強みにしたりできるでしょう。
新しく使えるデータを定義・収集する例として、スパーズが海外の選手の情報を集めて優れた外国人選手をリクルートしていたことも挙げていました(参考記事)。これはとても分かりやすい例ですね。
ここから具体例として、スティーブ・ナッシュのような選手を適切な順位でドラフトするにはどういうデータが必要だったかの検討や取り組みが紹介されたので、箇条書きでまとめます。
スティーブ・ナッシュのドラフト時に、予測モデルで彼の活躍を予測することはできなかった
彼の実力を判断する時に何を見逃していたのか、どのようなデータがあれば彼の活躍を予測できただろうと考えた時に、ある論文を目にした(Action anticipation and motor resonance in elite basketball players)
論文の内容は、プロ選手・プロコーチ・バスケに詳しいファンの3グループに対して、バスケのFTの映像をボールが手を離れる瞬間までを見せ、その後に決まるかどうかを予測させて、その精度とスピードを計測した。
結果として、プロ選手は他の2グループよりスピードも精度も高く、コーチとファンの間に違いはなかった。
また、脳波も計測したところ、バスケに詳しいファンとプロコーチは理性的な判断をする箇所の活動が盛んだったが、プロ選手は反射的な判断をする箇所の活動が盛んだった。
ここから、彼らは判断をするのに考える必要はなく、シンプルに反応をしているだけといえる。だからこそ、彼らの判断は素早く、しかも成功した選手ということは判断も正確であると言えそうである。
こういったデータを集めれば、ナッシュのような選手を評価したり、great athleteであるだけの選手を見分ける(大学ではそのフィジカルで通用するけど、NBAではフィジカルの優位性が薄まってしまい、他の強みもないので消えてしまう選手)こともできるのではと考えた
ただ、ドラフトの時に論文と同じように脳波を測るわけにはいかないので、代わりとしてプレーを途中まで見せた上で、その後に誰がシュートを打つのかを予測させて、その速さと精度を測るなどした
ドラフト予定のない選手のキャンプで試してみたところ、好成績を収めた選手がいて、その選手はケント・ベイズモアだった
これでナッシュの活躍を本当に予測できたかは分からないが、彼のドラフト時の評価を高くすることはできただろうと考えている
川崎ブレイブサンダースが日々の運動データを収集して健康管理(記事リンク)しているというのも聞きますし、選手の発言をテキストマイニングで分析するといった論文を見たこともあるので、新しいデータを見つけるというのもなかなか面白そうですね。
その他
今後、どのようなデータをトラッキングできるようになると良いかという質問があり、下記のような回答がありました。
「今のトラッキングデータは点でしか追えておらず、選手の向いている向きやスタンス、腕の位置など姿勢認識ができていない。
このようなデータまで取れるようになると、シュートフォームやDFの守り方を詳細に捉えられるようになる。これによって、例えばDFの守り方を踏まえた上でのシュートの質の評価ができるようになったりするだろう。」
このようなデータをトラッキングデータとして扱うのは、データ取得の観点でもデータ分析の観点でもなかなかハードルは高いものと思います。
しかし、逆に言えばこのようなデータをしっかり見れている人や組織は少ないとも言えるので、選手の姿勢とそれに付随するデータを集めて分析するのは相当な価値があるとも考えられます。
新しいデータを見つけるというアプローチとして面白そうですね。
第2回の講義内容のまとめは以上になります。
第3回の講義内容はこちらです。
この講義に関する記事は下記マガジンでもまとめているのでぜひご覧ください
もしよければTwitterのフォローもよろしくお願いいたします。
いいなと思ったら応援しよう!
