相手守備ブロックを基準としたパスの新指標とそれを使用した試合分析
今回の記事は私にとって挑戦的なものとなります。自分で新たなパスの指標を作成し、試合を見ながら手で集計しその実用性を検証してきました。その過程の紹介とその指標を使用した試合分析を行っていくというのが本記事の内容です。新指標がどのようなものかは後ほど説明しますが、なぜ挑戦的なものなのかを説明させていただきたいと思います。
今回の新指標はプレミアリーグの試合を見ながらパスを集計し、パスの種類ごとにポイント化していくというものです。しかし統計学を勉強したことがない私ですので、統計学を専攻したことがある方がこのポイント化をご覧になるとかなり雑で不十分だと思われるかもしれません。しかし私が自らの目で集計しなければいけないため、ビックデータの取得による統計的なポイント化ができません。このような点から統計学専攻でない私が本記事を書くことは挑戦的なことだと思っています。統計学的に見れば不十分な記事かもしれませんが、サッカー面から見れば面白い記事になると思いますので是非最後までご覧ください。
続編はこちら。
1.新指標を作成しようとした経緯
新指標について詳しく紹介する前に、これを作成するようになった経緯について書きたいと思います。
現在ではサッカーファンが誰でも簡単にデータに触れることができるようになりました。シュート数やパス数などの単純な指標はもちろん、ゴール期待値などの複雑な指標もデータサイトから閲覧できるようになりました。様々なデータが存在するなかで、どのデータが最も勝利に関係があるのか。これは誰もが知りたい疑問ではないでしょうか。現代サッカーではもちろんボール支配率が高いチームが勝利するわけではありませんし、シュート数が多くても決めきるFWがいなければ勝てません。一般のサポーターが入手できるデータではゴール期待値が最も勝利に関係するというのが私の意見です。
ゴール期待値を決める要因の一つに相手選手の位置が含まれています。これがゴール期待値は勝利に最も関係すると私が考えている理由です。サッカーは相手がいないと成立しないスポーツであり、相手を見ながらプレーします。しかしボール支配率などは相手選手が無視されたデータとなっています。ですので私は相手選手を基準とした指標が欲しいと考えました。しかし一人のサッカーファンである私が閲覧できるデータサイトにはそのようなデータは掲載されていません。掲載されていないなら自分で作ろうと思ったのが今回のきっかけです。
ではどのような相手選手を基準としたデータを作成するのか。サッカーの試合における最も多いアクションはパスです。つまりサッカーにおける最も重要なプレーはパスであり、勝利に関係するプレーもパスだと思います。ですのでパスに関する相手選手を基準とした新指標を作成しようと考えました。そんな時にFootballistaさんにパッキングレートというデータが紹介されている記事を見つけました。パッキングレートとは「1本のパスで何人の相手選手を通過することができたか」というものです。通過した相手選手の人数によって1本のパスをポイント化し、パスを受けた選手が前を向けるかどうかでさらにポイントが変化します。
詳しくはリンク付けた記事をご覧ください。このようにパス1本ことにポイント化する手法を取り入れたいと考えました。
2.新指標の基準である相手守備ブロック
パス1本ことにポイント化する手法を取り入れることにしました。次にポイント化する基準についてです。パッキングレートは通過した相手人数を基準としてポイント化しますが、私が考えた新指標は相手守備ブロックを基準とします。
上の図は攻撃する際にパスを送り込む優先順位を表しています。裏のスペースである①にボールを送り込めばGKと1体1になりゴールの可能性は高まります。しかし守備側もそれを一番警戒してくるため①にボールを送り込むことは困難です。つまり攻撃側の優先順位と難易度は比例しています。ですので④<③<②<①の順でボールを送り込むことが効果的です。詳しくは後ほど説明しますが、この順でポイントは高くなります。
私はレオザ学園というオンラインサロンでデータ分析をしています。そこでは試合分析の際に相手守備ブロックを基準としてパス数を集計しグラフィック化しています。
相手守備ブロックを基準として各エリアに名前をつけています。1つ特徴的なのが一般的にハーフスペースと呼ばれる場所がバイタルハーフという名前に変わっていることです。これはただのかっこつけではなく意味があります。ハーフスペースは一般的に「ピッチを縦に5分割したときの2と4番目のレーン」と定義されます。これはピッチ基準であるためボールと逆サイドのハーフスペースは本当に意図している場所とズレが生じます(相手守備ブロックがスライドするため)。しかしバイタルハーフは相手守備ブロック基準なのでそのようなことはありません。
データ分析の際はこの各エリアにパスが入った回数を集計し、パスが多かったエリアの色を濃くしてパスヒートマップというものを作成しています。実際に本記事の最後の試合分析で紹介います。
補足
Twitterで質問を受けましたので、補足説明として貼り付けておきます。
3.新指標EPP(Effective Pass Point)について
ここからは新指標の詳細について説明したいと思います。新指標EPPとはEffective Pass Pointの略で、どれだけ効果的にパスを回せたかを表しています。
ここからは実際の計算方法を紹介していきますが、先述したとおりビックデータから統計的に倍率を設定することができないため、私の感覚で計算しています。その点はご了承ください。
先ほど紹介したパスの優先順位の順に倍率が高くなっています。ファジーゾーン(赤)よりもライン間(青)にパスを送り込む方が難しいが、その分効果的なので倍率が高いということです。この計算の次に以下の計算をします。
パッキングレート同様パスそのものだけでなく、その後の展開も計算します。ただパッキングレートと少し違う点があります。まず前、横、後の3パターンで倍率は最低でも50%です。さらに倍率の基準は「パスを受けた選手の次のプレー」です。プレーとはパスやドリブル、クロスなどを意味しています。パスを受けた選手が前を向いてもその後にバックパスをしてしまう場合もあるので、プレーの向きを基準としてます。
この二つの計算をすることでパス1本のポイントを割り出し、その合計をEPPとします。
計算方法を紹介してもピンとこないと思いますので二つ例を紹介します。
1つめの例は裏にパスを送ったがパスを受けた選手が前を向けずバックパスをした場合です。上図のようなシーンはよくあることだと思います。この場合は裏へのパスで次のプレーは後ろ向きなので 1×1.8×0.5=0.9 となります。
2つめの例はフロントエリアにパスを出し、パスを受けた選手がそのまま前へドリブルをしたシーンです。この場合は 1×1.2×1=1.2 となります。
この二つの例でEPPの倍率の問題点がおわかりいただけると思います。1つめの例はバックパスをしたとはいえボールを前進することができています。しかし2つめの例のほうがEPPは高くなってしまいます。これが私が感覚で倍率を設定したために生じる問題点です。本来であればビックデータから統計的に倍率を設定するのが適切ですが、相手守備ブロックを基準にパス数を集計しているデータサイトはないのでどうしても感覚で設定するしか無くなってしまいます。理想は企業の方にご協力いただいて倍率を設定したいですが、私にはそんな力はないのでしょうがないです。笑
4.EPPとシュート数の関係
「今日の試合はEPPが高かったから上手くいった試合だった」というようにEPPを単体で使用することもできますが、EPPはシュート数と相関関係があるのでシュート数とともに使うことでより分析に役立たせることができます。
これはプレミアリーグのビック6の試合を15分間ずつ6分割し、ビック6とその相手チームのEPPとシュート数を横軸と縦軸にとった散布図です。ただしトッテナムはスタイルがスタイルなので、かなりの外れ値をたたき出したため除外しています。この二つのデータには相関関係があることがわかります。
相関関係があるということはトレンドラインの関数を算出し、そこにEPPを代入すればそのEPPを出した場合の平均的なシュート数をもとめることができます。そのために外れ値3つを除去し(相関係数は0.71)そのときの直線の方程式を算出しました。
xShotsとはexpected Shotsを意味しています(相関関係からもとめた値なのでexpectedが正しいかどうか微妙ですが)。
これを利用するとより深く分析することができます。例えばEPPは高いが得点が奪えなかった時に、実際のシュート数とxSを比較します。もし実際のシュート数がxSよりも少なかった場合、相手守備ブロックの中にパスを送り込むことはできたが、崩しきることができなかったと考えられます。また、パスヒートマップを使うことでどこにパスが入らなかったがわかります。
5.EPPを使用した試合分析~マンチェスターシティvsアストンビラ~
では最後にEPPを使用した実際の試合分析をします。取り上げる試合はマンチェスターシティvsアストンビラで、マンチェスターシティの分析となります。
上のグラフはEPPと先日紹介したPPS(パス数/シュート数)の推移です。下のグラフはxSと実際のシュート数(以下Shots)の推移を表しています。
こちらがPPSの記事です。
全ての時間帯でxSをShotsが上回っており、流石シティという感じ。61~75分ではこの試合で最も差が広がっています。そこで上のグラフを見るとこの時間帯ではEPPとPPSともに最も低い値です。このことから少ないパス数でシュートを打つことができているため、パス数自体が少なくEPPが高くならなかったことがわかります。
私が注目したのは1~15から16~30への変化です。EPPが減少しShotsも減少しています。つまり効果的にパスを回すことができなくなったためShotsも減少したということです。ここでこの2つの時間帯のパスヒートマップを比較してみます。
パスが3以下、4から7、8以上の3段階で濃淡を分けています。
最初の15分間では左サイドに攻撃が偏っています。左のバイタルハーフにパスが8本入っており効果的に攻めることができていたと言えます。この時間帯ではデブライネがバイタルハーフで何度もパスを受け、ファジーゾーンにいるフォーデンにパス。そこからフォーデンが仕掛けていくというシーンが多く見られました。
しかし次の15分間ではバイタルハーフにパスが入る回数が減り、右サイドにボールを回すこともできませんでした。そのため効果的にパスを回せずシュート数も減少したということが二つのパスヒートマップを比較することでわかります。
6.まとめ
今回このように自分で考え作成した新指標を紹介させていただきました。記事として不十分な点も多々あるとは思いますが、このデータの精度を高めていけばかなり有益なデータになると思っています。
今回紹介した使い方以外にも、選手ごとにパスを出した選手と受けた選手両方にEPPを付与したとします。そうすればEPPが高いDFやMFは効果的にパスを回せる選手、MFやFWは効果的にパスを引き出すことができる選手として評価することもできます。また、相手チームのEPPも集計することで相手のEPPが低ければ効果的に守備をすることができたというように、EPPを守備のデータとして利用することもできます。
このようにEPPにはかなりの可能性があると思っていますので、この考え方を多くの方に知っていただけたら嬉しいです。最後まで読んでいただきありがとうございました。