サルでもわかる超幾何分布から二項分布の導出
はじめに
確率分布関数は様々あり、私自身関係性ががとても分かりにくかったが題名の通り超幾何分布から2つの分布関数が導けることを学んだのでここに備忘録として残しておく。もはや準1級ではなく1級の範囲なような気がするが気のせいのはず。。。
超幾何分布から二項分布への導出の気持ち
まず概念的側面からの話を進めていく。
超幾何分布とはざっくりいうと、成功確率が一定でないベルヌーイ分布のことをさす。例えば$${N}$$個の玉があり赤玉$${M}$$個白玉$${N-M}$$個が入った袋から1個取り出し、赤玉が出る成功確率はもちろん$${\frac{M}{N}}$$である。次回にまた赤玉を取り出すことになったら袋の中の赤玉の数は変化しているので成功確率は変化する。
ここで母集団Nの数を限りなく多くしてみたらどうなるだろうか。
この状態は言い換えてみると、赤玉を取り出しても母集団の赤玉の数が膨大なので変化は出ないことに近似的になり復元抽出が非復元抽出になることに近似することができるのである!
これってつまり、、、お分かりいただけただろうか。二項分布そのものを表していることになる。
超幾何分布から二項分布の証明
では下記に数式での証明を記載する
まとめ
超幾何分布では成功確率は一定でないがこれを母集団を限りなく大きくすることで近似的に一定にすることをしているのが二項分布である。
またこれは非復元抽出から復元抽出に前提が移り変わっていることにも対応する。