見出し画像

ポアソン分布の例と導出

ポアソン分布について

ポアソン分布とは

 ポアソン分布は、ある事象が一定の時間内に発生する回数を表す離散確率分布です。もう少し砕いた言い方をすると「所与の時間中に平均で $${λ}$$ 回発生する事象がちょうど $${k}$$ 回($${k}$$は非負の整数)発生する確率」になります。
 例えば「1日に平均で3回電話がかかってくるとき、1日で5回かかってくる確率はどのくらいか?」のような問題を考えるときにポアソン分布が使えます。この場合$${λ=3}$$、$${k=5}$$となります。横軸にkをとってプロットすると以下のようなグラフになり、これがポアソン分布になります。

ポアソン分布のグラフ(wikipediaより)

ポアソン分布の式

ポアソン分布は以下のように表される

$$
P(X=k)=\dfrac{λ^ke^{-λ}}{k!}
$$

この式を満たすとき、「確率変数Xは母数λのポアソン分布に従う」という。
先ほどの例で$${λ=3}$$、$${k=5}$$とすると

$$
P(X=3)=\dfrac{3^5e^{-3}}{5!}\simeq0.10
$$

となり約10%と分かります。なので10日に1日は5回かかってくるわけです。(6回以上かかってくる日はこの確率に含まれていないので注意)

二項定理との関係

 ポアソン分布の$${λ}$$について二項定理との関係を探ります。説明は統計WEBさんの記事にあったものをそのまま持ってきています。
 次の図の青の横線は「ある期間」、赤丸は「その期間内である事象が起こった時」を示しています。ここで「ある期間(青の横線)」を非常に細かく分割します。

すると、分割した1つの期間内である事象が2回起こる確率は0と考えることができます。すなわち、分割した各期間の中で、ある事象が「起こった」か「起こらなかった」かのベルヌーイ試行と考えることができます。分割した期間が$${n}$$個である場合、ベルヌーイ試行を$${n}$$回行う二項分布となります。
 分割した期間の中である事象が起こる確率を$${p}$$とすると、二項分布の期待値である「ある期間に起こる事象の平均回数」は$${E[X]=np}$$と計算できます。すると$${λ=np}$$とすることができることが分かります。
 ここでもう一つ大事なのが、今回行った「ある期間を細かく分割する」操作をすることが$${n→∞}$$、$${p→0}$$かつ$${λ=const.}$$と言い換えられることです。このことがポアソン分布の式の導出につながります。また、$${n}$$が十分に大きく、$${p}$$が小さい二項分布がポアソン分布に近似できることもここで理解しておくと良いです。

例題

例として問題を解いてみます。
10000人に1人かかる病気がある。ランダムに100人連れてきて、この中にその病気にかかっている人が$${1}$$人だけいる確率はいくつか。

$${p=0.0001}$$、$${n=100}$$より$${λ=0.01}$$。起こる回数は1人なので$${k=1}$$より

$$
P(X=1)=\dfrac{0.01^1×e^{-0.01}}{1!}\simeq0.0099
$$

ポアソンの極限定理と導出

先ほどの話を式としてまとめると以下のようになる

$$
\lim_{λ=np,n\to\infty}\dbinom{n}{k}p^k(1-p)^{n-k}=\dfrac{λ^ke^{-λ}}{k!}
$$

これをポアソンの極限定理と呼ぶ。$${p=\frac{λ}{n}}$$として導出をすると

$$
\begin{split}
\lim_{n\to\infty}P(X=k)&=\lim_{n\to\infty}\dbinom{n}{k}p^k(1-p)^{n-k}\\
&=lim_{n\to\infty}\dfrac{n!}{(n-k)!k!}\Bigl(\dfrac{λ}{n}\Bigl)^k\Bigl(1-\dfrac{λ}{n}\Bigl)^{n-k}\\
&=lim_{n\to\infty}\underbrace{\Bigl(\dfrac{n}{n}\Bigl)\Bigl(\dfrac{n-1}{n}\Bigl)\cdots\Bigl(\dfrac{n-k+1}{n}\Bigl)}_{\simeq1}\Bigl(\dfrac{λ^k}{k!}\Bigl)\underbrace{\Bigl(1-\dfrac{λ}{n}\Bigl)^n}_{\simeq e^{-λ}}\underbrace{\Bigl(1-\dfrac{λ}{n}\Bigl)^{-k}}_{\simeq1}\\
&=\dfrac{λ^ke^{-λ}}{k!}
\end{split}
$$

となります。次回は期待値と分散について書きます↓


参考


いいなと思ったら応援しよう!