![見出し画像](https://assets.st-note.com/production/uploads/images/86615096/rectangle_large_type_2_f64584039d09a2a95ba2f16a40517874.jpeg?width=1200)
【高校野球千葉大会の優勝校予想#3】'22夏大の振り返り
こんにちは。いちかわきです。
前回説明した手順に沿って、今回は'22夏大のシミュレーション結果をご紹介します。
まえがき
一点ことわっておきますが、この記事を投稿した2022/09/11現在、夏の千葉大会は既に終わっています。それどころか甲子園も終わっていますね。後付けの予想であることを疑われる方もいらっしゃると思うので、今回の予想結果は試作のつもりで出します。この先をご覧になる方はそのご理解をお願いします。
'22秋大からは大会前に予想を公開する予定なので、次回以降が本番です。
'22夏大の予想を完成させたのは6/28で開会式は7/9だったので、後付けの予想はしていないつもりです。(あくまで私の自己申告でしかないですが)
数値実験は間に合ったけど記事の執筆は間に合わなかった、というのが正直なところです。
評価指標
何をもって予想が的中したと見なすか、ハッキリさせるのは難しいですね。ここでは次の2つの指標を主に使っていきます。
的中率
これはテーマの趣旨そのものですが、全試行回数のうち、予想が真の結果と一致した回数の割合を的中率とします。例えば1000回の試行のうち、「A高校が優勝した回数が600回、B高校が優勝した回数が400回」というシミュレーション結果が出たとします。このとき、実際の結果がA高校の優勝であれば優勝校の的中率は60%、B高校の優勝であれば優勝校の的中率は40%とみなします。また、的中率については予想範囲に応じて次の2種類を採用します。
例として、C高校の1000回の試行に対して次のような出力が得られ、実際の結果が準優勝であった場合を考えます。
$${\begin{array}{c|c|c|c}ベスト8&ベスト4&準優勝&優勝\\ \hline200回&300回& 400回&100回 \end{array}}$$
一次的中
特定のチームについて予想と実際の結果が完全に一致した事象の割合を一次的中率と呼ぶことにします。この例ではC高校を準優勝と予測した事象がそれに該当するので、C高校の一次的中率は400/1000で40%ということになります。二次的中
特定のチームについて、実際の結果を含む複数種類の事象が占める割合を二次的中率と呼ぶことにします。例えば「C高校のベスト4二次的中率」はC高校をベスト4以上と予想した割合を指すので(300+400+100)/1000で80%となります。
平均勝利数誤差
優勝校の予想さえ当たっていれば1回戦や2回戦はどうでもよいのか?という点も気になります。最大の目標は優勝校の予想を当てる事ですが、それと並行して1回戦から決勝戦までトータルの予想精度を高めていくことも考えていきます。
参加チーム数を$${T}$$、試行回数を$${N}$$とします。また、$${j}$$回目の試行におけるチーム$${i}$$の勝利数を$${WS_{i, j}}$$、チーム$${i}$$の実際の勝利数を$${WT_{i}}$$とします。このとき、平均勝利数誤差$${e}$$を次のように定義します。
$$
\displaystyle e=\frac{1}{NT}\sum_{i=1}^{T}\sum_{j=1}^{N}|WS_{i, j}-WT_{i}|
$$
シミュレーション結果
本題に戻り、シミュレーション結果です。赤数字が予想と実際の成績が一致した試行の回数になります。(Excelのスクショで恐縮です。TeXの表に変換する手間が…)
![](https://assets.st-note.com/img/1660524848480-6BZdc8ki8z.png?width=1200)
O列で各チームの実際の成績を数値で表していますが、これは「そのチームが何回戦まで進出したのか」を表すものです。例えば3回戦で敗退したチームは3になります。千葉大会は優勝までに最大8勝が必要なので、決勝は8回戦に相当します。つまり準優勝(=決勝で負けた)チームは8です。優勝チームはこれに1を足して9とします。
つまり、'22夏大の優勝予想はこちらの様になりました。↓
$${\begin{array}{c|l|c|r}&チーム&レート&優勝確率\\ \hline1&(A)木更津総合& 2441&41.9\% \\2&(A)市立船橋&2306&13.9\%\\ 3&(C)専修大松戸&2304&12.7\%\\ 4&(B)習志野&2269&10.3\%\\ 5&八千代松陰&2226&5.5\%\\ 6&(B)中央学院&2176&4.7\%\\ 7&(A)銚子商業&2173&3.1\%\\8&東海大市原望洋&2092&1.8\%\\ 9&(A)拓殖大紅陵&2151&1.6\%\\ 10&成田&2084&1.3\%\\ \hline&その他& &3.2\%\end{array}}$$
実際に優勝したのは市立船橋だったので、優勝校の一次的中率は13.9%ということになります。
この結果を妥当だと思うか外れすぎだと思うかは人それぞれなので皆様の感覚にお任せします。
確かに優勝校予想の本命は見事に外しましたが、前述の平均勝利数誤差を計算すると0.64となりました。木更津総合のベスト4二次的中率は80%である事など、局所的に高い精度で予想を当てられている箇所もあります。
私自身の感想としては…まあまあ?ですかね。
ドンピシャではないが言うほどボロボロでもない。
予想内容の更新
今回の予想を次以降の予想へ生かすため、ここからは手法の改良案を述べていきます。
まず、これは完全に言い訳なのですが、「大会前の予想はめちゃくちゃ難しい」という話をします。
1回戦すら終わっていない大会前の状態から決勝戦までの結果を予想するのは、プロ野球で言えば開幕前に優勝チームを予想するようなものだと言えます。
プロ野球では解説者の方々が毎年開幕前に優勝チームを予想しますよね。スポーツ新聞にズラッと一覧が並ぶアレです。
例えば2021年のプロ野球はセ・リーグがヤクルト、パ・リーグがオリックスの優勝となりました。この2チームは前年度まで2年連続で最下位だった事も話題になりましたね。
果たしてヤクルトOB、オリックスOB以外でこの2チームの優勝を開幕前から予想できた解説者の方はどれだけいたでしょうか?
※あくまで予想の難しさを主張するための引用であり、予想を当てられなかった解説者の方々を批判したいわけではありません。
開幕前の時点では、現有戦力や過去の実績を鑑みてソフトバンクや楽天をパ・リーグの優勝候補に推す解説者が多かった様です。
一方、開幕してからある程度の日程を消化した8月や9月の段階では「オリックスかロッテ、果たしてどちらが優勝するのか」という見方に移っていったと思います。
(こちらのサイトの説明が非常にわかりやすく、私がやろうとしている事のイメージも掴みやすくなると思います。)
これを高校野球に置き換えると「1回戦や2回戦の結果を踏まえて3回戦以降の予想内容を修正していく」といったものがプロ野球でいう8月や9月時点での予想に相当します。
全ての結果が分かっているのに知らない体でイチから予想をするのが後付けの予想ですが、こちらは既に知っている結果を予想の対象とせずに前提条件として扱い、未知の勝敗のみを予想するものです。
こちらを「中間予想」、開幕前の予想を「事前予想」とでも名付けておきます。
事前予想と中間予想を組み合わせる事により、開幕前から決勝戦前までの優勝確率の推移を見ることができます。
例として市立船橋の立場で考えてみれば、事前予想の1000回の試行は
準々決勝で中央学院に負けたパターン
準決勝で拓殖大紅陵に負けたパターン
決勝の相手が木更津総合ではなかったパターン
など、開幕前に考えられるあらゆる可能性が含まれています。
一方、準決勝までの試合結果を既知のものとして中間予想を行うと、上記の様な実際には発生しなかったパターンは排除されます。
つまり純粋に「2022/07/27の市立船橋vs.木更津総合」の勝率を求める事が出来るのです。開幕前の市立船橋の優勝確率とは異なる値になると考えるのが自然ですよね。
次回以降はこの中間予想について、
3回戦以降の中間予想
4回戦以降の中間予想
5回戦以降の中間予想
etc…
という形で段階的に提示していきます。
ここまでお読みいただきありがとうございました!
あとがき
今大会が始まる前に「過去10年間で夏に木更津総合を倒したことがあるのは習志野と専修大松戸の2校だけ」という事実が広まり、千葉県の高校野球ファンに衝撃を与えました。
今年は市立船橋がそこに加わりましたが、第1勢力が木更津総合であることは当分変わらないのではないかと思っています。
更新履歴
2022.09.11 初回投稿
2022.09.13 文章表現の軽微な修正