母比率の検定の検定統計量の証明
はじめに
母比率の検定の検定統計量は
$$
\begin{aligned}
Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1 - p)}{n}}}
\end{aligned}
$$
と表される
なんでこんな形になるか証明することで
丸暗記しなくても検定統計量を覚えることができるので
今回はこの検定統計量を例題も踏まえて証明していく
また検定統計量のざっくりイメージだけ知りたい場合は下記を参照
今回の仮定
確率分布
t検定みたいに一般的な仮説検定だと確率変数は正規分布に従っているが
母比率の検定では確率変数が二項分布に従っている
また、$${n}$$が十分大きいとき
ドモアブル・ラプラスの定理を用いると
$${二項分布 \approx 正規分布}$$ に近似できる
なので結局、母比率の検定の確率変数は正規分布に従っていると仮定するが
正確には二項分布に従っているので
検定統計量も二項分布のパラメーターで考える
確率変数
確率変数$${X}$$は独立同一な二項分布$${B(n,p)}$$に従っている
つまり、$${X}$$は成功確率$${p}$$の試行を$${n}$$回した成功回数を表す
検定統計量の証明
比率の確率変数
成功回数の確率変数は$${X}$$だったが
比率の確率変数は試行回数$${n}$$で割って$${\frac{X}{n}}$$となる
二項分布の再生性
仮定している二項分布は独立同一なので
二項分布の再生性から
$$
\begin{aligned}
X_1 \sim B(n_1,p) + X_2 \sim B(n_2,p) = X_1 + X_2 \sim B(n_1 + n_2,p)
\end{aligned}
$$
ここで今回の比率の確率変数は
$$
\begin{aligned}
\frac{X}{n} \times n = X
\end{aligned}
$$
となっているので
$$
\begin{aligned}
\frac{X}{n} \sim B(1,p) + \frac{X}{n} \sim B(1,p) + \cdots + \frac{X}{n} \sim B(1,p) = X \sim B(n,p)
\end{aligned}
$$
となり
$$
\begin{aligned}
\frac{X}{n} \sim B(1,p)
\end{aligned}
$$
となる
二項分布の正規近似
確率変数$${X}$$を成功確率$${p}$$のベルヌーイ試行を
$${n}$$回した成功回数とする
このとき$${X}$$は$${X \sim B(n,p)}$$で
$${E[X] = np, V[X] = np(1 - p)}$$となる
さらに$${n}$$が十分大きいとき、仮定で述べたように
上記の二項分布は下記のように正規分布に近似できる
$$
\begin{aligned}
B(n,p) \approx N(np , np(1 - p))
\end{aligned}
$$
確率変数は正規分布に従う
平均と分散の関係式
$$
\begin{aligned}
E[aX] &= aE[X] \\
V[aX] &= a^2V[X]
\end{aligned}
$$
を用いると
$$
\begin{aligned}
E\bigg[\frac{X}{n}\bigg] &= \frac{1}{n} E\bigg[X\bigg] \\
V\bigg[\frac{X}{n}\bigg] &= \frac{1}{n^2} V\bigg[X\bigg]
\end{aligned}
$$
となるので、二項分布の再生性と合わせて
$$
\begin{aligned}
& X \sim B(n,p) \approx N(np, np(1 - p)) \\{}\\
& \frac{X}{n} \sim B(1,p) \approx N\bigg(\frac{np}{n}, \frac{np(1 - p)}{n^2}\bigg) = N\bigg(p, \frac{p(1 - p)}{n}\bigg)
\end{aligned}
$$
検定統計量
上記で求めた正規分布のパラメーターを用いて
t検定のときみたいに
標準化して標準正規分布に従う統計量を求めると
$$
\begin{aligned}
Z &= \frac{X - (平均)}{\sqrt{分散}} \\{}\\
&= \frac{\hat{p} - p}{\sqrt{\frac{p(1 - p)}{n}}} \sim N(0,1)
\end{aligned}
$$
となり、これが母比率の検定統計量となる
t検定の復習はこちら