ブンデスリーガ無敗優勝の科学 〜 シャビ・アロンソがレバークーゼンに与えたものとは? 〜
※本投稿は、早稲田Uデータサイエンスラボの学生が作成したレポートを、ゼミ発表資料としてほぼ原文掲載しております。予めご了承下さい。
Abstract
アロンソ監督の下、2023・24シーズンを前代未聞のブンデスリーガ無敗優勝を達成したレバークーゼンだが、データで振り返るとパスの本数の増加やパスの距離の低下、マッチテンポの増加などが見受けられた。それと同時に「ポジトラ」の回数の増加やデュエル勝率の低さなど典型的なポゼッションサッカーでは考えにくいデータがいくつかあった。
結論としては、アロンソは守備時はしっかりとブロックを組んで、攻撃時にはしっかりボールを保持して相手陣内に入り、取られた瞬間に取り返す(昔のバルセロナの3秒ルールにちかい)ことを徹底しているとわかる。その結果としてアロンソ独自のポゼッションサッカーが生まれていることがわかる。
Method / Results
今回のデータ分析はアロンソが就任する前のレバークーゼンと就任後のレバークーゼンを比較する。2023年にレバークーゼンに就任してから、レバークーゼンはほぼ無敗で(リーグ戦は完全に無敗)でシーズンを終え、圧倒的な強さをリーグで見せているが、アロンソは一体何をクラブへもたらしたのだろうか。
私はレバークーゼンのサッカーを一度も見たことはないため、データからのみ違いを発見することができるはずである。
まず、データは15分単位で分割されているが、試合ごとで全ての15分ごとのKPIを平均してデータ分析を行う。各KPIは異なる単位で計算されているため、全てのデータを標準化するか正規化するが、90分という長い単位で見るため、データの中でのアウトライヤーは少ないと考え正規化を選択した。
単回帰分析データ
まず単純なデータの「差」を単回帰分析で比較する。
アロンソ就任前と就任後のデータを単純に引き算をし、絶対値を導くことでどのKPIが最も変化したかを確認する。
Fig.A は差を棒グラフで表したものである。最も大きく変化しているのは Average Pass Length、平均的なパスの長さである。他にもロングパスの頻度や前方へのパスの変化が大きいが、総合的に見て平均的なパスの長さの変化が大きいと言える。
平均的なパスの長さに絞ってアロンソ就任前と就任後を比較する。Fig.B がこれを比較したviolinplotとなる。
ポゼッションサッカー型のスタッツ
データからわかるように、まず平均してパスの本数や成功数が増えていることがわかる。また、全体のパスの中のロングパスの割合が少なくなっている。枠内シュートの本数も増加している。総合的に言えることとしては、ロングパスからショートパスへの大幅な変更を行い、全体的にマッチテンポを加速させた結果、シュートの本数が増えたと言えるでしょう。
重回帰分析データ
同様に重回帰分析を使い最も最終結果(アロンソが就任しているかどうか)に影響を及ぼしているかを確認する。重回帰分析の際の係数の絶対値を棒グラフに示したのがFig.C である。
この図からわかることは、機械学習アルゴリズムがどのKPIに注目してアロンソ就任前か後かを判別しているかが分かる。
同様にviolinplotにしたのがFi.D である。
特徴的なアロンソの守備
Fig.CおよびDから分かることとして、マッチテンポよりも左は特に「差」の分析と変わらないですが、右の二つのPPDAとRecovereisは最も注目されているものの単回帰分析の「差」には出て来なかったKPIである。
PPDAはPasses per defensive action 守備的アクション一つについて何本のパスが回されたかを測った数値である。小さい場合はハイプレッシャーを意味し、大きい場合はしっかり引いていることを示している。少しではあるが、PPDAはアロンソ就任後は上がっている、すなわち、より引いていると言える。
また、Recovereisはいわゆる「ポジトラ」の回数だが、アロンソ就任後の方が増えている傾向にある。
さらに相関関係が低いKPIを見ると、counterattacks / with shots、すなわち、カウンター時にシュートにどれだけいくことができているか、というデータがあるが、violinplotを見る限りは平均的な確率は下がっているものの、全体的にプロットが太くなっている、すなわち、一定に近い確率でシュートに行くことができている。数値の分散の低さはshotrs/on target(枠内シュート確率)にも反映されている。
Discussion
これらのデータからレバークーゼンはアロンソ就任前と就任後との間で:
単回帰分析の結果を「表面的な結果」とし、重回帰分析による結果を「表面的な結果につながる要因」と考える。
大きくパスサッカーに舵を切ったアロンソ
「表面的な結果」のみを見ると、レバークーゼンが大きくパスサッカーに転じたことがわかる。これはアロンソ監督のバルセロナでの経験などから生まれたスタイルとも言える。マッチテンポ(ポゼッション時間に対してパスの本数)が多いのも、スペイン流のティキタカがレバークーゼンにある、ということを示している。しかし、ただパスサッカーをしようと世界最高峰の選手を集めても良いパスサッカーができるとは限らない、ましては、レバークーゼンのような一年前までは優勝候補ですらなかったチーム(バイエルンが10連覇をしていたのもあるが)がたった1年間で無敗優勝をできるレベルまで上がるのには必ず理由がある。
データから見えてくる守備の変化
重回帰分析による結果を考えると、圧倒的に一番大きいのは「recoveries」の数値である。「Recoveries」は、いわゆる「ポジトラ」と同義語で、相手ボールの状態からマイボールにした回数である。ポゼッション率が下がって「ポジトラ」の回数が増えるのは相手が多くボールを持っていてその分ボールを奪取するチャンスが増えるため理解できるが、ポゼッション率が上がっている状態でポジトラが増えるのはなんとも不可解な事実である。
全てハイプレスというわけではなさそうだ
これを説明できるかもしれないのが、PPDAの増加である。PPDAの増加はチームがどれだけ「引いているか」を表現する数値で、高ければ高いほど引いていると言える。いわゆる「ドン引き」と言えるほどの数値の変化ではないが、アロンソ就任前よりも確実に引いていることがわかる。しっかり引いて守備から入り、ボールを奪取するとポゼッションに移るサッカーを展開することにより、recoveriesの回数が増えているのではないかと推測できる。
攻守の切替を早めているスタッツ
さらに矛盾しそうな点として、高い位置のRecoveriesは前年度と比較して大幅に上がっているのにもかかわらずPPDAが下がっている、というデータがある。これは推測ではあるが、ポゼッションサッカーにより敵陣でプレーする時間が増えるため、ボールを失った後に敵陣内で奪い返すことが可能になる。
しかし、最も不可解な点は、デュエル勝率、カウンターでシュートまで行く確率、枠内シュート率がどれも平均的に下がっているという点である。普通にサッカーを見ていればこれらの数値が大きければ大きいほどチームは強いと言えるが、最強レバークーゼンはアロンソ就任前とくらべて下がっている。これは一体何を意味しているのか。
これもまたデータを元にした推測ではあるが、カウンターでシュートまで行く確率の低下はある程度簡単に説明できる。ポゼッションを徹底するアロンソのレバークーゼンはよほどのチャンスでない限りボール保持を捨ててまでシュートに行くことはないだろう。そのため、データとしてはシュートまでいけなかったカウンターと認識されるが、その中で「意図的にカウンターのチャンスを放棄した回数」が多いのかもしれない。
攻撃回数が増えているであろう変化
枠内シュート率の低下はポゼッションをするチームを相手にした時に、敵が引いてしまい、その結果シュートが打ちづらくなるという現象と推測できる。また、デュエルの勝率の低下は、攻撃のデュエルの回数の増加によるものかもしれない。基本的にサッカーでは攻める側よりも守る側の方が特に空中戦などは勝率が高い。よりボールを保持して攻撃時間が長くなるのが原因で不利な攻撃側のデュエルが増加し、結果としてデュエルの勝率が落ちているのではないかと推測できる。
デュエル勝率、カウンターでシュートまで行く確率、枠内シュート率がどれも平均的に下がっているという点を推測すると、「普通のサッカー」では到達できないレベル、例えばカウンター放棄やデュエル勝率が落ちるまで攻撃回数が多いという現象や、相手に引かれてしまいロングシュートの回数が増えてしまうレベルにまでレバークーゼンが達していることがわかる。
戦術の浸透と徹底が読み取れるデータ
最後に指摘したい点として、総合的に見てデータの分散が減少しています。実際の数値は出ていませんが、violinplotを見れば一目瞭然です。平均当たりの数値が非常に多いです。これはアロンソのサッカーのシステム化によるものだと推測できる。分散が少ないということはチームでどんな相手でも同じサッカーを遂行することができている証拠であり、いちいち相手に合わせなくて良い強いチームだと言える。
データから見る限り、アロンソは守備時はしっかりとブロックを組んで、攻撃時にはしっかりボールを保持して相手人に入り、取られた瞬間に取り返す(昔のバルセロナの3秒ルールにちかい)ことを徹底しているとわかる。その結果としてポゼッションサッカーが生まれている。試合を見ているとつい「ポゼッションサッカー」という「結果」に目がいってしまいがちだが、アロンソ率いるレバークーゼンや世界中の強豪チームを参考にするときは、どんなコーチも「結果」よりもその結果につながる要因に集中すれば、より効果的な戦術が練れるのではないかと思う。
最近ペップシティの圧倒的強さから生まれたポゼッションサッカーの神聖化は、その奥に何があるかわかっていれば良いが、表面上ポゼッションサッカーを行うだけではなんも意味がない。
データには現れない"何か"
ここまでデータを振り返ってここまで結論が出たが、最後はアロンソ率いるレバークーゼンの異常と言えるほどの勝負強さに触れたいと思う。もちろんアロンソのサッカーのシステム化によってレバークーゼンは強くなったと言えるが、サッカー経験者やサッカーを長年見ている人なら理解できると思うが、0-1で負けている最後の10分は戦術よりも雰囲気や勝負に対する気持ちが非常に大切である。今年のレバークーゼンの勝負強さはレバークーゼンが31年前のリーグ優勝から溜まり続けてきた選手・チームスタッフ・ファンの勝利への執念と、自分たちの強さ(アロンソの戦術)への自信が組み合わさってできたものではないかと僕は思う。
データを分析してチームがどの点がどう改善したから強くなった、とサッカーをシステムとしてしれば知るほど、最後の最後は「人」であるところがサッカーの何よりも面白いところであるということに気付かされる。無敗優勝はアロンソがレバークーゼンにもたらせたものだけではなく、レバークーゼンがアロンソにもたらしたものとも言えるだろう。
Author
早稲田ユナイテッドデータサイエンスラボ所属
山藤緑夏(サンドウ ロナ)
広尾学園高等学校一年、東京都出身
名前の由来がロナウジーニョでサッカー歴は年齢と同じ。
鹿島かウェストハムが世界一になる日を日々夢見ている。
Chief Editor
早稲田ユナイテッド代表
岩崎 勇一郎
早稲田大学および大学院修了(工学博士・MBA取得)
研究職時代は遺伝子改変による遺伝的アルゴリズムの解析など
FC大阪 スポーツデータサイエンスディレクター
Xアカウント: https://twitter.com/iwasaki_wu
About this article
本投稿は、早稲田ユナイテッドデータサイエンスラボの学生が作成したレポートを、ゼミ発表資料として原文掲載しており、ゼミ内での質疑応答に使われております。
早稲田ユナイテッド データサイエンスラボとは
隔週で開催されている早稲田ユナイテッドデータサイエンスラボ(朝活のオンラインゼミ)では、上記のゼミ発表に対して、各種ローデータと共に、Jリーグやプロサッカークラブ現場における実践的なデータサイエンス視点から補足データ説明や現場見解の共有をゼミ生向けに随時行なっております。
プログラミングも学べる
早稲田ユナイテッドデータサイエンスラボでは、統計学に関わるプログラミング(Python・SQL・Rなど)を学習すると共に、世界のプロサッカービックデータ解析を通じて、定量的にサッカー界の原理原則を理解し、データサイエンス人材の育成・輩出と、日本サッカー界が発展していくための強化コンサルティングを現場実践していくことを最終的なゴールとしています。
ラボへの問い合わせ
お問い合わせはこちらから
▶︎ メールフォーム
▶︎ 公式LINE