ザングース/ハブネークの色違いの確率の訂正を解説してみた

久しぶりの更新

どうも、ガッツで乗り切る子ちゃんです。引き続き統計を勉強中。
キャッチアップリサーチから復帰したポケGOトレーナーです。

ザングースの色違いが超かっこいい

青いザングースが欲しい!!!ほしい!!!!!!!
しかしタップすれどもタップすれども赤色ザングース...
ますます欲しい気持ちが募ります。バトルで使えるわけでもないけど、ただただ愛でたいのです。かっこいい。。。

ところで確率渋くない!?全然でないよ!確率どんぐらいなんだ!?と全国のポケモンGOトレーナーが考えていることと思います。

確率調査隊といえば、海外のSILPHROADさんですね。
https://thesilphroad.com/science/quick-discovery/world-tourism-day-zangoose-seviper-shiny-rates/

SILPHROADさんは統計を専門的に学習されていることが文章からうかがえます。日本の攻略サイトやYouTuberはこちらを参考に確率(点推定値)について記載していますね。しかしながら日本のサイトで、きちんと統計的に正しく解説されているものはなかったので、自分の勉強のためにもnoteを書きたいなと思っていました。
そんな中、SILPHROADさんが最初に発表したザングースの出現確率が間違っていたことを発表しました。しかし、日本のサイトで一切情報の更新がされていなかったので、紹介したいと思います。

※9/28/2019 20:00 UTC UPDATEについて書きます

ザングースとハブネークについて、遭遇回数と色違いの回数を載せていましたが、集計を誤っていたそうです。

何が間違っていたのか?

日本では、ザングースが野生湧きし、ハブネークがフィールドリサーチの報酬ですね。もともとは、野生湧きによる色違いの確率と、フィールドリサーチによる色違いの確率は違うとして確率を発表していました。
しかし、それぞれの確率に統計的な差は認められなかったと改めて発表。つまり、ザングースの色違いの確率と、ハブネークの色違いの確率に違いがあるとは言えないとのことです。

何があったのか?

もともと、フィールドリサーチの達成が重たいので、フィールドリサーチによるハブネークの方が色違いの出現確率が高いと想定されていました。

この想定を検証するために、
帰無仮説:野生湧きによる色違い確率と、フィールドリサーチによる色違い確率に、差がない
対立仮説:差がある
と仮説を設定。Fisherの正確確率検定で検定。p-value < 0.00001となり、帰無仮説を棄却。つまり、「差がある」と結論付けていました。(検定の詳しい説明はまたいつか・・・。)

しかし、「色違い」の数の集計が途中から誤っていたことが判明。再解析したところ、「差があるとは言えない」という結論に訂正されました。

結局、ザングースの確率はいくつなの?

The accurate number of encounters and shinies found after aggregating both species are 8,977 encounters and 24 shinies, leading to a 99% confidence interval of 1 in 230 to 1 in 675.

野生湧きとフィールドリサーチで色違い確率が同じであると仮定し、再集計したものと思われます。つまり、ザングースとハブネークを合わせて、8977回遭遇したうち24回色違いが出たそうです。
点推定値で24/8977*100=0.2673498941740002‬%
99%信頼区間 [1/675, 1/230]=[0.148%, 0.434%]

99%信頼区間とは、8977回の遭遇を1試験として、この試験を何度も繰り返し集計しまくった結果、100試験中99試験は0.148%から0.434%の間に真の確率を含んでいるでしょうという区間です。

真の確率は誰にも分りませんが、だいたい0.15%~0.45%らへんが色違いザングースの確率と言えるでしょう

ただ、十分なサンプルサイズがまだ得られていないとして、引き続き調査を進めているようです。

・・・

にしてもやっぱり確率渋くね!?!?!?もうむりー!

おしまい。

いいなと思ったら応援しよう!