統計検定準一級受験記録④ 5章
検定準一級受験時に重要だと思った点を、統計学実践ワークブックをもとに僕なりにまとめていきます。専門的、厳密な解説はできませんが、誤りなどのご指摘があれば加筆修正を行っていきます。
5. 離散型分布
まずは出てくる分布のまとめ。
赤枠は特に重要で今後頻出です!
分布の式は、意味を覚えて導出できるようになるのがベスト。
自信がなければ二項分布、ポアソン分布は覚えておくといいかも。
期待値と分散も、二項分布、ポアソン分布は覚えておいて損はないはず。
ベルヌーイ分布は二項分布において$${n=1}$$の時なので、二項分布を覚えていれば大丈夫。
5-1 離散一様分布
$${X}$$が取りうる値が$${K}$$種類あり、それぞれが均等な確率で起こることと、全確率を足すと1なのでそれぞれの起こる確率は$${1/K}$$
期待値、分散は数列の和の公式から導ける。
5-2 ベルヌーイ分布
成功か失敗か、のような2択の試行を1回だけ行い、成功が$${x}$$回出る確率。
この式の導出に関しては、「二項分布において$${n=1}$$の場合」と考えた方が機械的にできて楽かもしれない。
※余談
式($${P(X=x)=p^xq^{1-x}}$$)を見ると、成功の時は$${q^{1-x}=q^{1-1}=1}$$に、失敗の時は$${p^x=p^0=1}$$になり、それぞれ式から消えてくれる。よくできてるけど、自分はこういうギミック的な面に注目して覚えてしまい、最初に自分で式を作ってみようとした時によく分からないけど違和感があった(完全に私的な感想)。結局、二項分布から作った方が分かりやすいなと思った。
5-3 二項分布
式の形は、「$${n}$$回の試行のうち、成功が$${y}$$回になる配置の組み合わせの数」×「成功確率を成功回数分だけ累乗」×「失敗確率を失敗回数分だけ累乗」という形になっている。
上述の通り、$${n=1}$$を代入するとベルヌーイ分布と同じ形になる。
この時$${y}$$は0か1しか取らず、$${_1C_y}$$は$${y}$$が0でも1でも$${_1C_y=1}$$
再生性があり、独立な二つの確率変数$${Y_1 , Y_2}$$がそれぞれ試行回数$${n_1, n_2}$$、確率$${p}$$の二項分布に従うなら、$${Y_1 +Y_2}$$は試行回数$${n_1+ n_2}$$、確率$${p}$$の二項分布に従う。
5-4 超幾何分布
ワークブックの説明をそのまま図化すると以下の通り。
28章の、フィッシャーの正確検定のところでまた出てくる。
5-5 ポアソン分布
低確率で起きる事象が、ある期間中に起こる回数の分布。
再生性があり、独立な二つの確率変数$${Y_1 , Y_2}$$がそれぞれ平均$${\lambda_1, \lambda_2}$$のポアソン分布に従うなら、$${Y_1 +Y_2}$$は平均$${\lambda_1+ \lambda_2}$$のポアソン分布に従う。
5-6 幾何分布
成功確率$${p}$$のベルヌーイ試行を繰り返し行った時、①「初めて成功するまでに起こる失敗の回数$${X}$$の分布」と、②「初めて成功するまでの試行回数$${W}$$の分布」という2種類の定義がある。成功回数の分を含めるため、$${W=X+1}$$となる。
5-7 負の二項分布
成功確率$${p}$$のベルヌーイ試行を繰り返し行った時、$${r}$$回成功するまでの間に起こる失敗の回数$${Y}$$の分布。
成功が$${r}$$回、失敗が$${y}$$回なので、並べ方が何通りあるかを考えなければ部分的には$${p^r q^y}$$という式が出てくる。これに並べ方の組み合わせ数を掛ければいい。ワークブックで紹介されている考え方を図化すると以下のようになる。
また、単純に以下のように考えても導き出せる。
ただ、最初にこれが思い浮かんでしまうと$${_{r}H_y}$$と$${_{r+y-1}C_y}$$との関連性までは行き付かないかもしれない。
5-8 多項分布
事象$${Y^{(1)}}$$が$${y^{(1)}}$$回、・・・事象$${Y^{(K)}}$$が$${y^{(K)}}$$回起こる時の確率のため、並べ方のパターン数を考えなければ$${p_1^{y^{(1)}} \cdots p_K^{y^{(K)}} }$$が出てくる。並べ方のパターン数は、全$${n}$$回のうち事象1が$${y^{(1)}}$$回、次は残ってる$${n-y^{(1)}}$$回のうち事象2が$${y^{(2)}}$$回・・・と考えていくので、$${_{n}C_{y^{(1)}} ×_{n-y^{(1)}}C_{y^{(2)}}\cdots×_{n-y^{(1)}-\cdots - y^{(K-1)}}C_{y^{(K)}}}$$となる。最終的にコンビネーションの中の階乗が連鎖的に約分されていくので最終的な式は上記のようになる。