[EURO 2024] 番外編 番狂わせを数値化してみる
グループリーグも終了し、一昨日から決勝トーナメントがスタート。下馬評通りの実力でノックアウトラウンドに進出したチームが居る一方で、波乱に満ちたグループもあり、また、アップセットと行かないまでもちょっと意外な結果に終わったグループもある。
個人的にハンガリー、ウクライナの敗退は予想外。どちらもここ数年で実力をつけてきた印象があっただけに、やや意外な結果に終わった。一方で、スロバキア、ルーマニアの通過はおそらく誰も予想できず、特にルーマニアの1位通過は一番のサプライズなのではないか。
と、ここまでは主観的な印象で語っているのだが、実際に、こうしたサプライズに映る印象が、何かしらの客観的データと照らし合わせても妥当な反応なのかが気になる。各チームの事前状態をあらかじめ指標として数値化してみたら、案外、印象とは異なるグループで番狂わせが起きている可能性もあったりしないかと推測。
そこで今回はそんなモチベーションを起点として、今大会で最も波乱が大きかったグループやチームを客観的に評価していきたい。直感と分析結果の間にある程度開きがあることを期待するが、最終的に両者が一致しても良しとしよう。
下馬評(ポテンシャル)の数値化
番狂わせと言うからには、まず、それぞれのチームについての事前の評判(期待値)が必要になる。人々の期待度という意味では、ブックメーカーの優勝オッズなどを指標にするのだろうが、ここではチームが持つ潜在的な実力に着目し、その客観的な指標の一つとしてEURO2024開幕時のFIFAランキングを採用する。
近年の対戦戦績といった相性の要素を入れ込む工夫も良いかもしれないが、ここではまずはシンプルなケースから始めてみる。
チーム間の実力差の数値化
実力差を表す指標として最も単純なものは「順位差」。フランス(2位)とオランダ(7位)、スペイン(8位)とアルバニア(66位)の実力差を比較しようとしたら、それぞれの差分を取るのが自然なはず。実際、フランス – オランダは5、スペイン – アルバニアは58で、それぞれの実力差を反映しているように思える。
ただ、ここで問題になるのが、下位と上位では、順位差と実力差の関係性が変わりうること(たしかな根拠はないが)。1位と30位、30位と60位はどちらも30の差だが、明らかに30位のチームが1位のチームを倒す方が難しいと感じる(チェコがアルゼンチンを倒すのと、パラグアイがエクアドルを倒すのでは印象が違うはず)。
したがって、比較するチームの順位によるノーマライズを行いたい。まず、平均順位で割るシンプルなノーマライズをしてみる。チェコとアルゼンチンなら、(34 - 1) /(17.5) = 1.89、パラグアイとエクアドルなら、(58 - 30)/(44) = 0.636となり、何となく実際の実力差に近付いた印象。
ただ、上位陣にこれを適用した際には違和感が。アルゼンチンとイングランドの場合、(5-1)/(3) = 1.33、イングランドと日本の場合、(17-5)/(11) = 1.09となり、アルゼンチンとイングランドの方が、実力差があることに。
おそらく、順位差に対して平均順位の重み付けが強すぎるのだろう。なので、ここでは平均順位の平方根を取ることにして、それで標準化してみる。アルゼンチンとイングランドで、(5-1)/(3) = 2.31、イングランドと日本の場合、(17-5)/(11) = 3.62、これで実際の感覚に近付いた印象。もっとしっかり検証したいところだが、これで進めてみる。式にするとこんな感じか。
チームの潜在的実力差:P(A,B) = (rA - rB) / ((rA + rB) / 2)^0.5
これをEURO2024の対戦カードに対して算出していく。結果としては、最も実力差の小さい対戦カードが、オーストリア(25位)とポーランド(26位)、実力差が最も大きい対戦カードが、ポルトガル(6位)とジョージア(74位)、これは直感とある程度一致している印象。
アップセットスコアの算出
次に、チームの潜在的実力差と、実際の試合結果の間にあるギャップを数値化する。両者を等価なものとして扱いたいので、試合結果も潜在的実力差に対応するように変換する。
試合結果についても、比較的単純な指標として、各試合の得失点差をそのままスコアとして利用することにしたい。引き分けなら0、4−1の勝利なら3、1−3の敗戦なら–2といった具合である。
その上で、「チームの潜在的実力差」と「実際の試合結果」の差分を取れば良いわけだが、両者のスケールは揃えた方が良いので、最大、最小が同じ範囲になるようにノーマライズする。
今回は、グループリーグでの最大点差、4点差を最大値としてノーマライズすることにする。それぞれのパラメーターの範囲が−4〜4に収まるようにした。こうすると、最大のアップセットが8、最小が0となる。
実際の適用例だが、下の図ではアルバニアとクロアチアのケースを取ったが、アルバニアを基準としたクロアチアへの潜在的実力差は–3.19。実際の試合結果は2-2の引き分け(スコア差0)なので、アップセットスコアは3.19となる。
妥当といえば妥当な結果だが
これを6つのグループの全試合結果に対して計算してプロットしてみた結果が以下の図。まずは、妥当性の確認という意味で個々の組み合わせを眺めていくと、直感的に最も番狂わせの印象が強いポルトガルとジョージアの組み合わせが、一番スコアが高い結果になっている。次点が、ルーマニア – ウクライナ、スロバキア – ベルギーで直感とそこまでズレはない。
個人的にあまり意識していなかったが、スロベニアがイングランドを引き分けに持ち込んだカードも結構なアップセットと言ってよい結果になった。またグループAのドイツ-スコットランド、グループBのスペイン-クロアチアもFIFAランク以上にスコア差のついた結果だったようだ。
グループで見ると、E組、そして次がB組という結果に。E組が最も番狂わせが起きていた点は予想通りな気がしたが、B組に関しては、やや意外な結果となった。元々の順位差以上に拮抗、もしくは差が開いた試合展開になったということか。言われてみれば、アルバニアは順位こそ上位には来ていないが、かなり強豪国にも肉薄した印象(ただし勝ちは無かった)。逆にクロアチアはスペイン相手に順位以上に大差を付けられており、そういう意味でも番狂わせになった印象。
チーム別で見てみると
チーム別で見ると、最も下馬評を覆す戦いを見せたのが、アルバニア、逆に最も期待外れの結果だったのが、ベルギー(これは妥当な結果な気がするが)。アップセットスコアが低いチームは強豪国に偏っており、この点は、そもそもパラメータ上そうした傾向になりやすいのか、本大会特有の傾向なのか、大会間での比較が必要になりそうだ。
強豪国に絞ってみると、ドイツやスペインが下馬評以上の戦いを見せている結果になった。2チームとも近年FIFAランクが下降気味ではあるが、ここまでの戦いに絞ってみればかなり順当に勝ち進んでいる印象だ。
中堅と呼べる国で最も期待外れだったのがウクライナ。ルーマニア相手にあそこまで完敗することは予想できず、個人的にも最も衝撃的な試合結果の一つ。
敗退こそしてしまったがアルバニアが最も高いスコアを叩き出しており下馬評以上の戦いを見せたということか。実際、決勝トーナメントには進めなかったが、強豪国相手に一歩も引かない戦いを見せていた。突破の難易度としては、スロバキアやジョージアよりも高かっただろう。
ただここは議論の余地が有り、スロベニアやオーストリアの方が強豪相手に善戦した印象が強く、アルバニアの方はむしろ2敗している。一点差の敗戦と引き分けの間には、勝ち点の重みとしてはかなりの差があるはずで、この差が今回のアップセットスコアではあまり反映されていない。
この辺りのギャップは、使用する指標(FIFAランク)、パラメーター算出方法によって変わりそうだが、ある程度妥当で、多少の驚きがあるという、個人的な満足感としてはなかなか上出来な印象。
ここに、近年の戦績や各選手の所属クラブの戦績なども入れていくと、アップセットスコアが0に近付いていくのかなという気もするが、時間ができた時に試していきたい。
また、こうしたアップセットの数値化は研究も進んでいる気がするので、折を見てしっかりとリサーチしていきたい。決勝トーナメントでも、引き続きスロベニアやオーストリアの番狂わせを期待したいところだ。
この記事が気に入ったらサポートをしてみませんか?