MEGA BIGは「公平なくじ」であるか
MEGA BIGを買った時に選ぶ結果はハウス側がランダムに決めていると前回の記事で述べた。
今回は実際に第1476回MEGA BIGの結果を見ながら検証を行う。なお当方は統計学の専門家でなく、もし内容に不備や誤りがあればご指摘いただきたい。
今回の検証意義
今回のように多額のキャリーオーバー・試合中止による当選確率上昇は過去にも起きており、(雰囲気的に)検証された。
第1322回では3試合が中止となり投資口数1,800,857で、期待される1等の当選数6.9口に対して実績は5口という結果だった。
今回検証する意義はサンプル数に起因するものだ。今回の投票口数は1,500万口を超え第1322回のサンプル数の8倍以上であり、統計的に2倍以上精緻な結果が得られると期待できる。本筋とズレるため精度についての議論は割愛する。
検証
BIGのようなコンピューターによるランダム選択のくじにおいて、何をもって「公平」と言うかは諸説ある。ここでは純粋に「1等を狙う上でランダムな選択は不都合だったか?」という観点で検証しよう。
1等の組み合わせは実際の試合の結果から決まるが、その結果に対応したランダムな選択は行われていたのか?という観点である。極論を言えば、コンピューターがランダムに選んだ結果は1等の組み合わせが決して起きない(または非常に起こりにくい)偏りがあるのでは?ということだ。
ここでは、1等で計算上期待される当選口数と実際の当選口数を切り口に検証してみる。これらの間に大きな乖離が見られた場合、コンピューターによるランダム選択で何らかの偏りあったと推察される。
2日の11時40分ごろには結果が公表されていた。結果は予想された1等口数240に対して、実際には29口上回る269口だった。
1等の口数が269口以上となる確率は、$${P(269≦X) =1-P(X<269) = 1-Φ(z)=1-Φ(1.891)≒0.0293}$$となり、約2.9%の確率で発生する事象だった。
※理論は本記事の最後に掲載
今回のような「あたり回」としては妙にテール部分を引いているが、極端にありえない確率ではなかった。そのためMEGA BIGは公平でないとは言えない、というのが今回の検証結果である。
くじは公平だったのか
残念ながら(?)、期待されたような「ランダムな選択は偏っている」という説を支持する結果を得られなかった。
過去の当選口数を見ても極端な上振れ・下振れという意味で、MEGA BIGはアンフェア説の根拠は見つからなかった。
とはいえ、今回くらいのブレが仮に下振れだった場合、期待値実現を夢見て落胆した投機家がより多かったと考えると、複雑な感覚ではある。
また別の観点として1人が大量購入し選択された結果に偏りがあったのでは?という疑問を持たれる方もいるだろう。もし偏りがあるなら1等を1口以上当選させるために大量購入する戦略はワークしない可能性がある。しかし筆者はそれを検証できるほど購入しておらず不明である。今後の検証が待たれる。
参考:結果公表遅延について
通常であれば全試合の結果が判明する22時ごろから少し時間が経った後に各社サイトで当選結果を確認できるようになる。しかし、今回はシステム処理の影響で翌日の9時発表になると発表された。同様の遅延自体は過去にも起きている。
ただし、2日の9時時点でも結果は発表されていない。
→9時30分に公表時刻を12時へ延期すると発表
参考:理論
12試合のうち4試合は当てなくてもよいから、実質的に予想対象は8試合。単純化するため、MEGA BIGで選ぶ4つの選択肢は同程度に発生する事象とする。(正解となる確率はすべて25%)
例として、1等の実際の当選口数が230以下($${k=230}$$)となる確率を計算する。投資口数$${n=15,710,882}$$であるから、1等当選に関して統計量を次のとおり計算できる。
確率(1等が当たる確率):$${p=(1/4)^8=1/65,536}$$
期待値(1等の予想口数):$${μ=n*p=239.72}$$
分散:$${σ^2=np(1-p)≒239.72}$$
標準偏差:$${σ=15.48}$$
大数の法則により正規分布$${N(μ,σ^2)}$$で近似し、
標準化:$${z=(k-μ)/σ=-0.628}$$
累積確率:$${P(X≦230) = Φ(z)=0.2649}$$
つまり約26.5%の確率で1等は230口以下となる。
おわり