二項分布について

2024年9月25日 15:52

今回は二項分布について。
今回は測度論は扱いません。

まずA,Bは事象とする。

今回は事象の独立の定義をして
Bernoulli分布を定義する。
そこから二項分布を定義する。
という方針でやっていく。

また離散分布における期待値と分散の計算方法は既知であることを前提とする。

独立の定義

A,Bは事象とする

P(A∩B)=P(A)P(B)

のときAとBは独立である。

さて、この定義はイマイチだと思う。
何が独立なのか？と。

そこで以下のように変形する。
ここではP(A)≠0とする。
先ほどの式の両辺をP(A)で割ると

P(B|A)=P(B)

となる。
こちらの方が圧倒的に解釈しやすいと思うが0でないという断りが必要だからかあまりこちらは定義にされない。

(正確な)コインを投げることを考える。
ここでは表が出ることに注目する。

すると
各試行は①独立で②結果は表裏の各1/2
であるはず。

さて、これを一般化することでまずBernoulli試行をきちんと定義する。

(先ほどのように)
①各回の試行結果は独立で
②注目している結果(成功、失敗)の起こる確率は一定
の試行をBernoulli試行という。

2種類の結果を値0,1で表し、値1である確率をp,値0である確率をq=1-pとする。
1回のBernoulli試行で得られる結果の従う分布をBernoulli分布という。

X〜B(1,p)として
EX=p
VX=pqであることは容易に分かる。

成功確率pのBernoulli試行をn回行うとき、成功回数Xが従う分布を二項分布といいB(n,p)と書く。

この定義を採用すると二項分布の期待値と分散はBernoulli分布のそれをn倍すれば良い！と分かる。
実際X〜B(n,p)として
EX=np
VX=npqである。

そしてX〜B(n,p)のとき

$${P(X=k)=\dbinom{n}{k}p^kq^{n-k}}$$

と書ける。
さて、こちらで表した時に期待値、分散の定義に従って計算しても当然同じ結果が出る。
が、かなりめんどくさい...

例をあげる。

(フツーの)サイコロを100回振ることを考える。
この時素数の目が出る回数をXとする。
すると
X〜B(100,1/2)
でEX=50,VX=25

なるほど、二項分布ってすごい！となっていただけたら幸いだがこれだけでは
？？？となるかもしれない。
まあそれは当然で、ほんの導入しかしてないから仕方ない。

ここからは少し発展的な内容をかるーーーくゆるーーーく書いてみる。

ある動物園のゾウは野球チームAが勝つか負けるかを予想している。
なんとこのゾウは10回中8回も勝つと的中させた！
だからこのゾウはほんとうに勝つことを分かっていたのだ！

あるいはコインを10回投げて8回表、2回裏だった。
だからこのコインは表が出やすいイカサマコインだ！

さて、これらはほんとうに正しい主張なのか？

X〜B(10,1/2)として
P(X=8)+P(X=9)+P(X=10)=0.055>0.05

からフツーのコイン、フツーのゾウだとしても5%以上は表(勝つと予想)が8,9,10回出ると言えるので、まあたまたまかな、、となる。

あとは二項分布の正規近似も面白い。
これを理解するには中心極限定理を理解する必要があるが...
でも高校数学では公式のように扱われているのを見ると「まあ専門家でもない限りそれでも良いのかな...」とも思う。

#数学がすき

3,204件