艦これの検証を見るための統計のお勉強のまとめ
大学で統計習ったけど、全く覚えてない人のまとめなので、話半分でお願いいたします。
間違ってたら教えていただけるとめっちゃうれしいです
1.件数が少ない場合(2項分布っていうらしい)
ある事象p%の確率で起こると仮定する。
その事象がn回の試行回数中x回起こった。この確率は
$$
{}_n C_x\times p^x \times (1-p)^{(n-x)}
$$
である。
同様に「p%の確率で起こるある事象がn回の試行で起こる回数がx回以下」である確率は
$$
\sum_{0\le k\le x}{}_n C_k\times p^k \times (1-p)^{(n-k)}
$$
である。
この確率が十分に低ければ、p%で発生する事象がn回中x回起こる可能性はほとんどないため、p%であるという仮定が間違っていた可能性が高くなる。
つまり、この事象の発生率はp%未満ではないかと考えられる。
2.件数が多い場合
上の式でnが十分に大きいと
$$
{}_n C_x\times p^x \times (1-p)^{(n-x)}
$$
がめちゃくちゃ小さくなってまともに計算できない。
なので近似を使う。
2項分布はnが十分に大きいと次の関数に近似できる
$$
f(x)=\frac{1}{\sqrt{2π}σ}e^{(\frac{-(x-μ)^{2}}{2σ^2})}
$$
$$
μ=np
$$
$$
σ=\sqrt{np(1-n)}
$$
また、この関数は、μ=0、σ=1の関数に変換できる。
$$
f(x)=\frac{1}{\sqrt{2π}}e^{(\frac{-x^{2}}{2})}
$$
この関数は以下のようなグラフになる。
![](https://assets.st-note.com/img/1701611316757-z3ShMxeSGF.png?width=1200)
このグラフの1.96より大きい部分を合計すると2.5%になる。(右側の赤の部分)xも変換すると
$$
\frac{x-μ}{\sqrt{\frac{σ^2}{n}}}
$$
になる。よって、
$$
-1.96\leq\frac{x-μ}{\sqrt{\frac{σ^2}{n}}}\leq1.96
$$
のとき、p%という仮定が正しい可能性が95%であるといえる。
3.信頼区間
上の式を変換すると以下のようになる。
$$
x-1.96\times\sqrt{\frac{σ^2}{n}}\leqμ\leq x+1.96\times\sqrt{\frac{σ^2}{n}}
$$
ここでnが十分に大きい場合、pは
$$
\frac{x}{n}
$$
とほぼおなじになるはすなので、置き換えて上記の式を計算すると、
n回試行してx回成功した場合、その確率は上記の範囲にある可能性が95%以上といえるらしいです。