ヤンキーでもわかる第1種の過誤
第1種の過誤を調べると大体このように書いてある
ここで重要なのは「帰無仮説」「有意水準」という言葉だが
復習も兼ねて具体例を挙げて考えてみる
帰無仮説とは仮説の等式
マサラタウンのサトシが
トキワの森でピカチュウを10匹捕まえたときに
体重が{1,1,2,4,4,5,5,5,6,7} kgだったとする
この標本平均は4kgであり、
母平均6kg 、母分散36の正規分布に従うと仮定する
このとき手元のピカチュウが6kgよりも軽いものばっかりで
ピカチュウの体重が本当に6kgかどうか疑うのが普通だろう
これを検証するために
帰無仮説:ピカチュウの体重は6kgである(等式)
対立仮説:ピカチュウの体重は6kgでない
有意水準とは帰無仮説が正しいかどうか判断する基準
設定した帰無仮説が本当に正しいかあ判断するには基準がいる
この基準のことを有意水準とよび一般的に0.05で設定されることが多い
今回の例ではピカチュウの体重が本当に6kgなのに6kgでないと結論づけてしまう確率が5%と非常に稀なケースという解釈になる
このように帰無仮説が正しいのに帰無仮説を棄却してしまう確率のことを第1種の過誤という
なので
と理解して差し支えない
第1種の過誤(Type I エラー)と検定統計量の確率分布図
下図のようにいつも使われる図は実は
帰無仮説が正しいときの検定統計量の確率分布である
ここまでの話についてきてる人なら
検定統計量が有意水準を超えている水色部分が第1種の過誤というふうに
理解できるであろう