二項分布について
今回は二項分布について。
今回は測度論は扱いません。
まずA,Bは事象とする。
今回は事象の独立の定義をして
Bernoulli分布を定義する。
そこから二項分布を定義する。
という方針でやっていく。
また離散分布における期待値と分散の計算方法は既知であることを前提とする。
独立の定義
さて、この定義はイマイチだと思う。
何が独立なのか?と。
そこで以下のように変形する。
ここではP(A)≠0とする。
先ほどの式の両辺をP(A)で割ると
P(B|A)=P(B)
となる。
こちらの方が圧倒的に解釈しやすいと思うが0でないという断りが必要だからかあまりこちらは定義にされない。
Bernoulli分布
Bernoulli試行の導入
(正確な)コインを投げることを考える。
ここでは表が出ることに注目する。
すると
各試行は①独立で②結果は表裏の各1/2
であるはず。
さて、これを一般化することでまずBernoulli試行をきちんと定義する。
Bernoulli試行の定義
Bernoulli分布の定義
X〜B(1,p)として
EX=p
VX=pqであることは容易に分かる。
二項分布の定義
この定義を採用すると二項分布の期待値と分散はBernoulli分布のそれをn倍すれば良い!と分かる。
実際X〜B(n,p)として
EX=np
VX=npqである。
そしてX〜B(n,p)のとき
$${P(X=k)=\dbinom{n}{k}p^kq^{n-k}}$$
と書ける。
さて、こちらで表した時に期待値、分散の定義に従って計算しても当然同じ結果が出る。
が、かなりめんどくさい...
例をあげる。
(フツーの)サイコロを100回振ることを考える。
この時素数の目が出る回数をXとする。
すると
X〜B(100,1/2)
でEX=50,VX=25
あとがき的な
なるほど、二項分布ってすごい!となっていただけたら幸いだがこれだけでは
???となるかもしれない。
まあそれは当然で、ほんの導入しかしてないから仕方ない。
ここからは少し発展的な内容をかるーーーくゆるーーーく書いてみる。
ある動物園のゾウは野球チームAが勝つか負けるかを予想している。
なんとこのゾウは10回中8回も勝つと的中させた!
だからこのゾウはほんとうに勝つことを分かっていたのだ!
あるいはコインを10回投げて8回表、2回裏だった。
だからこのコインは表が出やすいイカサマコインだ!
さて、これらはほんとうに正しい主張なのか?
X〜B(10,1/2)として
P(X=8)+P(X=9)+P(X=10)=0.055>0.05
からフツーのコイン、フツーのゾウだとしても5%以上は表(勝つと予想)が8,9,10回出ると言えるので、まあたまたまかな、、となる。
あとは二項分布の正規近似も面白い。
これを理解するには中心極限定理を理解する必要があるが...
でも高校数学では公式のように扱われているのを見ると「まあ専門家でもない限りそれでも良いのかな...」とも思う。