VARは試合時間を延ばしたのか。
1,はじめに。
こんにちは、こんばんは、はじめまして、むらやっちです。
tukamatterさん、画像お借りしましたm(_ _)m
今年度のJリーグは本格的にVARが導入されました。
正確にはJ1に導入されたということになりますが、観戦してて煩わしさを感じている方も多いかと思います。
ゴールしたあとのVARタイムは心臓に悪いですよね・・・
自分の場合、2021年2月27日に行われた柏レイソルvsセレッソ大阪の試合において、前半のアディショナルタイム(以下、AT)が6分だったのをみて「正気か!?」と思いつつ、「VARって試合時間伸びるのかな?」という疑問を持ちました。
結論だけ書いておくと、
今回の統計ではVARは試合時間を延ばしていませんでした。
以下、興味があればお読みください。
2,VARってなに?
まずはVARとはなんなのか、JFAのHPで復習しましょう。
これがVARです。HP内の文章でも触れられていましたが、2018年のW杯でも導入されていたので「知ってるよ!」という方も多いかと思います。
ゴールラインテクノロジーと勘違いされていた方もいるでしょうか。
これは、VARとは別のものです。
さて、VARがどんな場面で活用されるのか。
1 得点かどうか
2 PKかどうか
3 退場かどうか
4 警告退場の人違い
前述のHP内にも記述されている通りで、この4つに限定されています。
さらに
5 主審が確認できなかった重大な事象
(ペナルティエリア内でのハンドかどうかなど)
という部分でも活用されているのは、皆さんご存じの通りです。
つまり、得点シーンと得点や退場に絡むファールのシーンで活用されますよ!ということですね。
3,導入前後はどんな感じ?
実際に重大な事象の場面では、このように活用されています。
とすると、得点シーンがあるとVARの機会が増えそうな気がしてきました。そしてVARが増えれば、試合時間も延びそうな気がしてきます。
実際、判定時間はATに加算されることになります。
ということで仮説を立てました。
VARが導入されると全体的に試合時間が延びる
VAR導入前から懸念されている問題の一つで、改めて提唱するほどのものではないですが、やはり気になるところになります。
導入前はこんな感じで考えられていたようですね。
実際にはなかなか難しくて
昨年のゼロックス杯ではVARが導入されたことにより、3-4分はチェックに時間を費やされたようです。
ちなみに、Jリーグでは本当は2020年シーズンから導入の予定だったんですが新型コロナウィルス感染症の問題で開幕戦では導入されたものの本格運用は見送りとなりました。
準備は進んでいたんですけど、致し方ないところですね。
4,統計解析
さて、本題に入ります。
今回は平均ATが実際に長いのかどうかという観点から、昨年のJ1第2節から29試合と今年のJ1開幕戦から29試合で比較をしました。昨年分を第2節からにした理由は、飲水タイムの有無の要素を省きたかったためです。(統計をとった時点の試合数で見てます)
得点数やファール数など、VARの機会の数に影響されそうな要素がありますが、考慮していません。また、年度によりジャッジの基準が少し変わるので本来であれば今年のJ1とJ2で比較したかったんですが、J2のATがわからなかったのでやめました。
こちらのデータからアディショナルタイムを見ています。実はATがちゃんと表記されていない試合もあって、そこは別のとこを見たりした数値が3,4個あります。ちょっとずれが生じています。
得点表記してますけど、参考だけです。目的とずれるので、得点を含んだ統計解析はやめました。ATの単位は「分」になります。
知りたいことは、「VARが導入されると全体的に試合時間が延びる」かどうかです。
今回統計で扱うデータの母集団は、
sofascoreのデータを参照した、
2020年2節からの29試合の前半AT 2021年1節からの29試合の前半AT
2020年2節からの29試合の後半AT 2021年1節からの29試合の後半AT
2020年2節からの29試合の合計AT 2021年1節からの29試合の合計AT
こちらのデータを扱うことになります。
帰無仮説は、「2020年と2021年の前半、後半、合計ATに差がない」
対立仮説は、「2020年と2021年の前半、後半、合計ATに差がある」
統計は、エクセルに標準装備されているデータ分析や関数で行いました。
p<0.05を有意差ありとしています。
さてまずは、「2群の平均の差の検定」をすることになるので、二つのデータが「正規分布に従うのかどうか」を「正規性の検定」をすることになります。しかし、手元にSPSSはないしエクセル統計もありません。
サッカーのアディショナルタイムですからね、たぶん正規分布に従っているでしょう、省こうと思います。
パラメトリック検定を選ぶことになります。
次に大事になってくるのが、分散になります。
これも勇気を持って省きたいところですが、エクセルでは等分散かどうかを調べる「F検定」というものが標準で実装されています。
こちら、前半分になります。
こちら、後半分になります。
見事に等分散でないことが証明されました。
ということで、今回使う統計はこちらです。
Welchのt-検定
ということで、ドンッ!
前半のAT、2021年と2021年の29試合で差があるのかどうかです。
変数1が2021年の前半AT、変数2が2020年の前半ATです。
前半は有意差がありませんね。
さらにドンッ。
こちらが後半分。
変数1が2021年の後半AT、変数2が2020年の後半ATです。
こちらも差がないですね。。。。
最後に合計ATの分析を行います。
合計ATはF検定を行うと。。。
これはあれです。等分散のようです。
Studentのt-検定の出番です。
ということで、こちらのデータを見るとびっくりです。
2020年2節からの29試合と2021年1節からの29試合、平均合計ATがほぼ一緒になりました。6.931034分ぐらい。これ、扱う数値間違ってないか何回か見直すはめになりました。数字って、扱ってみないとわからないものですねー、びっくりしました。
5,結果
ということで、
「2020年と2021年の前半、後半、合計ATに差がない」という帰無仮説は採用されることとなりました。
統計学的には、本当は差があるかもしれないけど、どの程度差があるかわからないよ!という奴ですね。
ということで、
VARが導入されると全体的に試合時間が延びる
という予想ははずれたっぽいです。
正直、運用初期は人為的な要素もありつつ、色々と延びる要素が多いんじゃないかなと思ってたんですが、そんなことはなかったです。
それより驚きのデータが発掘されたので、個人的にはやってよかったです。
統計、あまり得意じゃないんで、間違ってたら教えてください!!