アジアカップ いろいろやってみた予測と答え合わせ

概要

・FIFAランキングと似たような予測精度でした.

・カタールはランキングにもレーティングにも現れない形でチームを強化していました.

本文

アジアカップグループステージ展望と答えあわせを書いてきました.

GSでは統計的な予測手法でほとんど当たってるよね!という景気のいい記事を書いたのですが,決勝トーナメントの結果は皆さんご存知の通り.この結果の定量的評価についてまとめます.

延長で決着がつかなかった場合を引き分けとみなしたとき,提案手法もFIFAランキングも予測精度は同じでした.評価の高いほうからの勝-分-敗は以下でした.

・R16:5-2-1,QF:2-0-2,SF:0-0-2,F:0-0-1

QF以降予測が外れています.

予測得点割合と実得点割合の散布図を示します.

相関係数が0.1台で,ほとんど相関がありません.これは予測得点割合を算出する根拠であるレーティング値と,試合時点での実力に差があることを示しています.

(提案手法の観点での)番狂わせ,つまり予測勝率が低いのに勝利した試合の上位3つは,カタールー韓国(10.3%),カタールー日本(17.8%),そしてカタールーUAE(21.7%)でした.また,6試合外れたうちの4試合がカタールが勝った試合です.ですので,「カタールの実力評価をもうちょい正確にする方法は無かったのかな?」という観点にたどり着きます.

実力評価に利用したデータは過去4年間の国際試合,ただしロシアワールドカップまで,でした.すると,最初に思いつくのは,「去年の8月以降カタールはどうしてたの?」です.残念なことにFIFAのサイトが更新されて,全国際試合を見ることはできなかったんですが,この期間でのカタールは6試合4勝1分1敗でした.確かに勝ち越ししてはいますが,アジア上位国との差が明確に詰まった,とこれらの試合で統計的に判断するのは難しいです.

また,決勝前に,準決勝までの50試合の結果を追加してレーティングを算出しなおしましたが,それでもカタールの評価はUAEやウズベキスタンに届かない,という値でした.

そもそも統計的手法は急激な変化を検出するのが苦手である(提案手法は4年分に重み付けしている),ことも踏まえると,ここで予測が大きく外れたのは,「カタールはランキングにもレーティングにも現れない形でチームを強化しており,アジアカップという公式戦でその成果を披露することができた」と結論付けられそうです.当たり前な感じですが,統計的な手法はおおむね当たり前なことを当たり前と言うための方法だったりするのですよね.

いいなと思ったら応援しよう!