毎日統計14
昨日は離散の確率変数に対する代表的な確率分布と応用例を学んだ。
捕獲再捕獲法で利用される超幾何分布、ネット販売のコンバージョンなどの推定で用いられる二項分布(ベルヌーイ分布)、事故遭遇や不動産の売れる確率などで使われるポアソン分布、結果が出るまで試行し続ける場合を考える幾何分布と負の二項分布、一様確立の場合の一様分布。
今日はこれに引き続き、連続な変数における分布を学ぶ。
今日の教材もいつものこちら。
正規分布(ガウス分布)
最も代表的な連続型の確率分布。自然界、人間界の多くの現象に当てはまる。
この定義式は、期待値と分散を用いた形で表されている。(覚える必要、あるのかな・・・)なお、正規分布は中央値=平均値となり、x軸が漸近線となるグラフの形状である。
この正規分布が有力なのは、抽出元の母集団の分布がどのような分布に従っていても、𝑛が大きければ、その標本平均の分布は正規分布に従うという特徴があるためだ。この特性が測定誤差などに当てはめられている。よって測定が存在するところには正規分布が関わってくると言う意味で、とてもよく使われている。(誤差が正規分布に従うと仮定すると・・みたいなフレーズは確かによく聞く。)
この証明は次の章で中心極限定理をやるのでそのタイミングで。
なお、平均=0、分散=1の時を特に標準正規分布と呼ぶ。標準正規分布には、その平均から離れた範囲にどの程度の確率で存在しているかを示した分布表が、多くの教材に付けられている。見方は以下のサイトを参照のこと。(ちなみに以下サイトは教科書の方とは逆の範囲の確率が出るようになっている。)
最後に、正規分布では分散(というより標準偏差?)の値に関して以下の特徴がある。
すなわち、標準偏差の3倍の数値の範囲で、確率分布は99.7%(=3/1000)となる。これはつまり、1000回に3回この範囲から外れると言うことをさすため、ほぼすべてがこの範囲内に入ると言う意味となり、特別に3シグマ範囲と呼ばれている。
指数分布
機械が故障してから次に故障するまでの期間や、災害が起こってから次に起こるまでの期間のように、次に何かが起こるまでの期間が従う分布である。前章で学んだ待ち時間分布(負の二項分布)を連続型にしたものに相当すると考えられる。
一定の期間にλ回発生する現象が、ある期間においてX回起きる確率分布。としてよく用いられる。例題ではラーメン屋の話がよく出てきてお腹が空いた。
ガンマ分布(※実はこれ以下は2級の範囲外)
αというパラメータを用いて、指数分布を一般化したもの。少々解釈が難しいが、こちらのサイトを参照すると、、、(パラメータの命名が少し違うので注意)
https://mathtrain.jp/gammadist
1/λの期間において1回起きるようなランダムな現象が、α回起こるまでの時間に関する確率分布と言うことになるらしい。製品部品の寿命やウイルスの潜伏期間などが、この分布に当てはまるらしい。なるほど、確かに。
ちなみにガウス分布において必要なパラメータαとλを使って、Ga(α,λ)と書くが、α=n/2,λ=1/2の時を特に、自由度nのカイ二乗分布と呼ぶ。
ベータ分布と一様分布
ベータ分布は、実際の現象としての例は少ないが、ベイズ統計学での役割が大きいらしい。ベータ分布は(0,1)上の確率分布であり、任意の正の数αとβの二つによって定義される確率分布。特徴として、αとβの値によって、針金細工のように如何様にも分布の形状を変更できるらしい。なので、ある程度の分布の形状が分かっている時に、何かしらの関数を当てはめたい時に、ベータ分布を使うことが多いらしい。
一旦、今回はここまで。
実は、教材には上記以外にも有名な確率分布として、
コーシー分布
対数正規分布
パレート分布
ワイブル分布
と言うものがあるらしい。ただ、いずれも書籍内で詳しい解説がないことに加え、統計検定2級では扱わないので、ここはさらっと読んで飛ばそうと思う。
と言うことで、本日は以上。
この記事が気に入ったらサポートをしてみませんか?