ヤンキーでもわかる第1種の過誤

2023年7月7日 19:02

第1種の過誤を調べると大体このように書いてある

第1種の過誤は、帰無仮説が正しいにも関わらず帰無仮説を棄却し、有意水準を超えて有意差があると結論付けること。

ここで重要なのは「帰無仮説」「有意水準」という言葉だが
復習も兼ねて具体例を挙げて考えてみる

帰無仮説とは仮説の等式

マサラタウンのサトシが
トキワの森でピカチュウを10匹捕まえたときに
体重が{1,1,2,4,4,5,5,5,6,7} kgだったとする

この標本平均は4kgであり、
母平均6kg 、母分散36の正規分布に従うと仮定する

このとき手元のピカチュウが6kgよりも軽いものばっかりで
ピカチュウの体重が本当に6kgかどうか疑うのが普通だろう

これを検証するために
帰無仮説：ピカチュウの体重は6kgである（等式）
対立仮説：ピカチュウの体重は6kgでない

設定した帰無仮説が本当に正しいかあ判断するには基準がいる
この基準のことを有意水準とよび一般的に0.05で設定されることが多い

今回の例ではピカチュウの体重が本当に6kgなのに6kgでないと結論づけてしまう確率が5％と非常に稀なケースという解釈になる

このように帰無仮説が正しいのに帰無仮説を棄却してしまう確率のことを第1種の過誤という

なので

有意水準＝第1種の過誤を犯す確率
→ ピカチュウの体重が本当に6kgなのに6kgでないと結論づけてしまう確率

と理解して差し支えない

下図のようにいつも使われる図は実は
帰無仮説が正しいときの検定統計量の確率分布である

ここまでの話についてきてる人なら
検定統計量が有意水準を超えている水色部分が第1種の過誤というふうに
理解できるであろう