ペケとジマの確率統計 #3 二項分布
登場人物
ペケ
理系,学部1年.
メガネが四角い
ジマ
文系,ペケの先輩.
メガネが丸い
ジマ:ペケくぅん.オレがペケくんと殴り合いして勝つ確率を$${p}$$として,オレが$${n}$$試合中$${k}$$勝する確率を教えてくれ.引き分けはないものとするよォー.
ペケ:$${p=1}$$じゃないんスか?
ジマ:今ここで検証するか?
ペケ:結構です.僕が勝つ確率が$${(1-p)}$$だから,$${{}_n\mathrm C_kp^k(1-p)^{n-k}}$$ですね?
ジマ:高1レベルの問題だねー.ということは,確率変数の考え方で言ったら,$${X=\{0,1,\cdots,n\}}$$で$${X=k}$$が起こる確率は
$$
P(X=k)={}_n\mathrm C_kp^k(1-p)^{n-k}
$$
となるな.これを確率変数$${X}$$は二項分布$${\Beta(n,p)}$$に従うと言うよォー.
高校までの$${{}_n\mathrm C_k}$$じゃなく,二項係数を複素数に拡張した一般化二項係数
$$
\begin{aligned}
&\binom yx :=\frac{\Gamma(y+1)}{\Gamma(x+1)\Gamma(y-x+1)} \\
\\
&\left(ガンマ関数:\Gamma(x+1):=\int_0^\infty t^xe^{-t}\mathrm dtはx!の一般化\right)
\end{aligned}
$$
も適宜使っていくから覚えてくれよなァーー.
ペケ:縦長だし,ベクトルに酷似していて見づらいですが,こうやって書く利点は?
ジマ:まぁ見てなって,分かるから.で,次の性質がある.
$$
\begin{aligned}
&E[X]=\sum_{k=0}^nkP(X=k)=\sum_{k=0}^nk\binom nk p^k(1-p)^{n-k}として,\\
\\
&E[X]=np\\
&V[X]=np(1-p)
\end{aligned}
$$
ペケ:へー.確率変数が$${x_k=k}$$でそれが起きる確率が二項分布だと,平均と分散がキレイな形になるんスね.
これ高校でやった等比数列を微分するやつだと思うんですけど,簡単にやる方法とかないんスかね?
ジマ:お前中卒かァー?高校で$${{}_n\mathrm C_k=(n/k){}_{n-1}\mathrm C_{k-1}}$$っていう性質やっただろ.
$$
\begin{aligned}
E[X]
&=\sum_{k=0}^nk\binom nk p^k(1-p)^{n-k}\\
&=\sum_{k=1}^nk\binom nk p^k(1-p)^{n-k}\\
&=\sum_{k=1}^nk\frac nk\binom {n-1}{k-1} p^k(1-p)^{n-k}\\
&=np\sum_{\ell=0}^{n-1}\binom {n-1}{\ell} p^{\ell}(1-p)^{(n-1)-\ell}\\
&=np\big(p+(1-p)\big)^{n-1} \ (\because 二項定理)\\
&=np
\end{aligned}
$$
ペケ:あー.高校のとき,$${k{}_p\mathrm C_k=p{}_{p-1}\mathrm C_{k-1}}$$だから,$${0 < k < p}$$で$${p}$$が素数のとき$${{}_p\mathrm C_k}$$が$${p}$$で割り切れるっていう整数の有名題でやりました.
分散はこれを使って,
$$
\begin{aligned}
V[X]
=\sum_{k=0}^n(k-np)^2\binom nk p^k(1-p)^{n-k}
\end{aligned}
$$
となるから,これを計算すれば...良いんだろうけど,計算が大変そうだな.形がシンプルになるってことは巧いやり方あるんスかね?
ジマ:あまり教科書に載ってない技巧的な求め方があるよォーwww
前回までの確率変数の積の性質と線形性を用いて,
$$
\begin{aligned}
V[X]
&=E[X^2]-E[X]^2\\
&=E[X(X-1)+X]-E[X]^2\\
&=E[X(X-1)]+E[X]-E[X]^2\\
\end{aligned}
$$
と変形できるじゃん?$${E[X(X-1)]}$$計算できるー?
ペケ:$${x_k(x_k-1)=k(k-1)}$$だから,
$$
\begin{aligned}
E[X(X-1)]
&=\sum_{k=0}^nk(k-1)\binom nk p^k(1-p)^{n-k}\\
&=\sum_{k=2}^nk(k-1)\binom nk p^k(1-p)^{n-k}\\
&=\sum_{k=2}^nk(k-1)\frac nk\frac {n-1}{k-1}\binom {n-2}{k-2} p^k(1-p)^{n-k}\\
&=n(n-1)p^2\sum_{\ell=0}^{n-2}\binom {n-2}{\ell} p^{\ell}(1-p)^{(n-2)-\ell}\\
&=n(n-1)p^2\big(p+(1-p)\big)^{n-2} \ (\because 二項定理)\\
&=n(n-1)p^2
\end{aligned}
$$
てことは,
$$
\begin{aligned}
V[X]
&=E[X(X-1)]+E[X]-E[X]^2\\
&=n(n-1)p^2+np-(np)^2\\
&=np(1-p)
\end{aligned}
$$
スゲー!!
ジマ:だろォー?二項係数の表記変えた理由分かった?
ペケ:$${\binom{n-1}{k-1}}$$が横長にならないし,添え字がデカいから長くなっても見やすいんですね.あと,さっきの公式も
$$
\begin{aligned}
\binom nk=\frac nk\binom {n-1}{k-1}
\end{aligned}
$$
と,階乗の関係式$${n!=n(n-1)!}$$みたいに見えて覚えやすいですね.
ジマ:そォーー.ちゃんと気づけたようで.
#3のまとめ
二項分布$${\Beta(n,p)}$$に従う確率変数$${X=\{0,1,\cdots,n\}}$$の
期待値:$${E[X]=np}$$
分散:$${V[X]=np(1-p)}$$