【論文紹介】「パス成功率って、そのままでいいの?」【プレミアリーグ】
結城康平さんがfootballistaで投稿された以下の記事について、サッカークラスタのみなさまがTwitter上で有益な議論をされています。
パス、評価、新たな指標...なんか覚えているぞ、そんなことを提案していた論文...ってことで、無料の文献管理ツール「Mendeley」の"サッカー"フォルダを確認したところ、ちゃんとありました!STATS社のデータサイエンティストの方々が著者となっている「"Not All Passes Are Created Equal:" Objectively Measuring the Risk and Reward of Passes in Soccer from Tracking Data」という論文。採択された会議はKDD2017というデータマイニング分野のトップカンファレンス。まじ半端ない!かっこいい!
1. はじめに
論文タイトルを意訳するならば、「ティキタカってパス成功爆上げしたところで、その数値って意味あんの?」というところでしょうか。論文のイントロダクションには以下のような例が示されていました。チェルシーのマティッチがボールを持っていたとして、左はセスクへの横パス、右はコスタへの縦パスです。どちらがリスキーでありながら効果的であるかは一目瞭然でしょう。しかしながら、現在使われている(?)パス成功率という指標の元には同じ成功/失敗としてカウントされてしまうのです。時間を作るパスも重要なのでしょうが、右のような”相手のライン間に刺す”パスを狙う選手も定量的に評価してあげたいよね!ということもモチベーションになっています。
2. 提案手法
具体的にはそれぞれのパスをより有意に評価するため、"risk"(リスク)と"reward"(ご利益)という2つの指標を以下の特徴量から算出します。
(1)パサーとレシーバーのスピード
(2)パサーとレシーバーの最も近い位置にいる守備者のスピード
(3)パサーとレシーバーの最も近い位置にいる守備者の距離
(4)上記守備者のパスラインに対する角度
(5)ダイレクトパスか否か
(6)ボールポゼッションの持続時間
どれも直感的なものばかりですが、(4)が少し分かりづらいかと思うので短く解説を入れておきます。以下の画像のような状況(パサーP1、レシーバーP2とP3、守備者D1)を想定します。
この場合、D1のパスラインに対しての角度は(P1->P3)よりも(P1->P2)のほうが小さい。したがって、リスキーなパスは後者の(P1->P2)であることがわかります。パスのリスク特徴量に「守備者のパスラインに対する角度」が含まれるのは、理解できます。
上記の特徴量を算出することで、ボール保持者がもつパスラインの"risk"と"reward"が以下のように可視化することができます。赤く太い濃い線ほどパスの難易度が高く、緑で細く薄い線ほど簡単に通せるパスであることが示されています。イントロで提示したモチベーションをちゃんと回収できていますね。これでマティッチも喜びそうです。(山口蛍の無計画なバイタルへのくさびはやめてほしいけれど)
3. 実験結果
手法の説明はこれまでにして、個人的に面白かった実験結果をまとめてみます。まずはこの記事のヘッダーにした実験結果から。2016-2017シーズン プレミアリーグ 第31節 シティ× ユナイテッド のマンチェスターダービーのスタッツとなっています。
上3つの棒グラフはよく見かける、ポゼッション率・パスの総本数・成功したパスの本数となっています。それに加えて可視化されている下の3つが本論文が提案している指標です。上から危険なパスの本数、奪われるリスクの高いパスの割合、危険なパスの割合になっており、シティの方が奪われるリスクが低く、危険度の高いパスを多く配給していることがわかります。したがって、ユナイテッドよりシティの方が効果的なポゼッションがこの試合でできていることがこの指標で把握できました。
次は試合中のあるシーンをピックアップして、提案手法の貢献を確認します。上4つの図がゴールまでに繋がったパスラインとその危険性、そして最下部の図が横軸が時間、縦軸がシュートにつながる確率を表しています。結果的に右下のウィリアン->セスクのパスがアシストになったわけですが、このゴールを生んだパスは最下部の図の曲線が急上昇しているセスク->ウィリアンであると結果から見てとれます。したがって、アシストよりもある意味重要な”決定的なパス”を本論文は自動的に発見できるという特徴もあります。
ほかにも面白い実験結果があったのですが、長くなるので今回はここまで。感想としては決定的なプレイであるアシストやゴールの前のパスを評価できるのはすごく面白いのかなと。アシスト数は稼げていないけれど、意外と香川とかが決定的なパスの本数が多かったりしてね。とりあえず、こんなデータを日常から分析できる人たちのことをバカ羨ましく思います。それでは。
#論文紹介 #KDD #KDD2017 #データマイニング #データ分析 #Python
#サッカー #フットボール #アナリティクス #Jリーグ