仮説検定を世界一丁寧にわかりやすく(統計的な推測⑫)

2024年12月15日 18:24

皆さんこんにちは。ゴリバと申します。

「仮説検定がわかりません！！！」

何度言われたかことでしょう…
仮説検定をどのように教えたらわかってもらえるか。
生徒の反応をみて試行錯誤し、たくさんの時間をかけて教材研究のうえ作りました。かなりの自信作です。

「先生の授業わかりやすい！！」「仮説検定完璧！！」
おかげさまで生徒が声をかけてくれるようになりました。

コンセプトは以下のようにしています。

教科書に沿って、補足するイメージ。
初学者向けで、偏差値50を目指す。
わかりやすさ重視で、細かい部分は省略する。

では以下が本編です。

仮説検定とは？

ある事象について仮説を立て、それが正しいかどうかを検証する方法です。仮説は次の2種類に分かれます。

対立仮説：自分が主張したい仮説
帰無仮説：対立仮説に反する内容を示す仮説

仮説検定では、「帰無仮説が正しいと仮定」して検証を進めます。

しかしなかなか難しい…
生徒の脳内は「？」でいっぱいです。

どのように教えればいいか凄く悩みました。
教科書の通り教えても全然わかってくれない…

そこで死ぬ気で教材研究しました。
いくつかのパターンを作り、仮説検定の教え方を試しました。

するとようやく「これだ！」というものをたどり着くことができました。

生徒からは、凄くわかりやすかった！！！
と高評価を頂きました。

ポイントは、生徒にとってイメージしやすい具体例を作ることでした。
では私がどのような流れで仮説検定を教えたのかを記載していきます。

仮説検定は背理法に近い

仮説検定の考え方は、数学で使われる「背理法」と似ているよ。
数Ⅰで√２が無理数であることの証明をやったの覚えてる？

背理法

ある命題が正しいかを証明するときに「もしその命題が間違っていたら？」と仮定し、矛盾が起こるかを調べる方法

しかしピンと来ていない生徒が多いです。
そこで大人気の探偵漫画の力を借りて、説明をしていきます。

CONAN：LANが殺人犯として疑われている…？
そんなはずはない。無実を証明しよう。

LANが無実であることの証明

①「LANが犯人ではない」を証明したい
②「LANが犯人である」仮説を立てる
③ アリバイがあるか捜査する
④ 捜査の結果アリバイがあり、犯行は不可能
⑤「LANが犯人である」仮説と矛盾
⑥ よって仮説は誤りであり、「LANが犯人ではない」

これが背理法の流れです。
実は仮説検定も同じような流れです。

①「LANが犯人ではない」を証明したい→「対立仮説」
②「LANが犯人である」仮説を立てる→「帰無仮説」
③ アリバイ捜査→「標準化して、確率を求める」
④ LANにアリバイあり、犯行は不可能→「確率は非常に小さい」
⑤「LANが犯人である」仮説と矛盾→「偶然ではない」
⑥ 仮説は誤りで「LANが犯人ではない」
→「帰無仮説が間違いで、対立仮説が正しい」

対立仮説と片側検定・両側検定

対立仮説が示したい主張です。
対立仮説には2種類の仮説の立て方があります。

対立仮説の内容によって、片側検定か両側検定が決まります。

片側検定：ある数値が「～より大きい」または「～より小さい」と示したいときに使う。（例 p>0.5やp<0.5）

両側検定：ある数値に「差がある」や「偏りがある」ことを示したいときに使う。この場合、大きいか小さいかは問わない。（例 p≠0.5）

では片側検定と両側検定の例を考えてみましょう。

片側検定の例：「ある製品がリニューアルされ、品質が以前よりも良くなっているかどうかを調べたい」

両側検定の例：「ある製品がリニューアルされ、品質が以前と変わっているかどうかを調べたい

片側検定の場合は、「品質が良くなった」というプラスの方向でしか考えていません。

一方両側検定の場合は「品質が変わった」であり、プラスの方向とマイナスの方向どちらも考えています。

したがって、「何を示したいのか」が大事です。

ちなみにこれは発展の内容ですが、両側検定の方が片側検定よりも厳しい基準になります。
理由としては同じ5%のとき、両側検定の場合は左右に分けられるので、片側で言うと半分の2.5%となるからです。

帰無仮説

対立仮説を否定したものとなります。
基本的に「=」を用いた式となります。

対立仮説→帰無仮説
p>0.5　 → p=0.5
p<0.5　 → p=0.5
p≠0.5　 → p=0.5

全て同じ

よくある質問

対立仮説は帰無仮説を否定したものですよね？
対立仮説がp>0.5であるとしたら、
否定した帰無仮説はp≦0.5ではないのでしょうか。

違います。帰無仮説はp=0.5となります。
「不等式の否定」ではなく、「仮説の否定」です。
p=0.5でないと、確率が計算できません。

有意水準

先ほどのconan君の場合は「アリバイが見つかるかどうか」で、犯人であるかを判断しました。

一方仮説検定では、「起こる確率が非常に小さいかどうか」で判断します。

「非常に小さい」とはあいまいなので、基準を事前に決めておく必要があります。この基準を有意水準（危険率）といいます。

有意水準は、5%(0.05)や1%(0.01)で設定されることが多いです。
例えば、薬の治験のような命に関わるような場合には、より厳しい基準である1%が使われます。

注意点として有意水準は、検定を始める前に決めておくことが大切です。
基準を後から決めると、都合のいい解釈ができてしまいます。

なお数学では、問題文で与えられるので心配はいりません。

有意水準5%として、検定せよ。

こんな感じ

なお、有意水準の範囲を「棄却域」と言います。

結論に要注意

conan君の場合で考えてみましょう。
アリバイが見つかったとき、「LANは犯人でない」と結論付けます。

一方アリバイが見つからなかったとき、結論はどうなるでしょうか。

①「LANが犯人ではない」を証明したい
②「LANが犯人である」仮説を立てる
③ アリバイがあるか捜査する
④ 捜査の結果アリバイが見つからなかった

このとき、「LANが犯人である」というのは誤りである。
正しい結論は、「LANが犯人でないとは言えない」です。

「アリバイなし→犯人」だと断定するのは強引です。
アリバイがないということは、犯人であるかどうは判断できないわけですからね。

仮説検定の場合も、基準より確率が大きかった場合に注意が必要となります。詳細は次の仮説検定の例で取り上げます。

仮説検定の例

あなたはカジノへ行き、コインの表裏を当てるゲームに参加しました。
ルールは表が出ればディーラーの勝ち、裏が出ればあなたの勝ちです。
100回コインを投げて表が70回出ました。
大負けし、あなたはこう思いました。
「もしかしてイカサマコインなのではないか…」

コインを１回投げて、表が出る確率をpとします。
普通のコインであれば,p=1/2であるはずです。
基準(有意水準)を5%と決めて検定しようと考えました。

ここであなたの主張(対立仮説)は２通り考えられます。

１は「表が出やすい」と大きい方のみを考えているため、片側検定。
２の場合は小さい方と大きい方の両方を考えているため、両側検定。

図でまとめると次のようになります。

ここから、もう一度カジノへ行って100回勝負をします。
今回は次に2パターンで考えてみます。

① p≠1/2と仮説を立て、→100回中70回表が出た世界線
② p>1/2と仮説を立て、→100回中56回表が出た世界線

① p≠1/2と仮説を立て、→100回中70回表が出た

今回は両側検定なので、2.5%ずつが棄却域となります。
この赤のラインに入った場合に、起こる確率は非常に小さいと判断します。

標準化すると、基準は1.96であるとわかりました。
表が７０回のとき、Ｚ値は4であり、1.96よりも大きい。
したがって棄却域に入るので、偏りがあると判断できる。

② p>1/2と仮説を立て、→100回中56回表が出た

今回は片側検定なので、右側の5%が棄却域となります。
この赤のラインに入った場合に、起こる確率は非常に小さいと判断します。

標準化すると、基準は1.645であるとわかりました。
表が56回のとき、Ｚ値は1.2であり、1.645よりも小さい。
したがって棄却域に入らないので、偏りがあるとは判断できない。

棄却域に入らなかったときの結論で、「偏りがない」は誤りである。
アリバイが見つからない→犯人確定がおかしいのと同じです。

あくまで、「今回の場合は判断できなかった」というスタンスです。
つまり、インチキコインの可能性は残っているけれど、今回の実験ではそれを証明できなかっただけです。

指導のポイント

ここまでの解説で仮説検定がどういうものか理解できたはずです。
仮説検定の流れを最後にまとめて練習問題を解かせましょう。

①示したい主張(対立仮説)を考える：
ここで片側検定か両側検定かが決まります。

②対立仮説に対になる主張(帰無仮説)を考える：
必ず＝☐となります。

③基準（有意水準）を考える：
基本的に問題文に基準が書かれています。5%か1%

④標準化して確率を求める

⑤基準より大きいか小さいかで結論を出す：
・基準より小さい場合（棄却域に入る場合）→帰無仮説が否定され、対立仮説が成り立ちます。
・基準より大きい場合（棄却域に入らない場合）→帰無仮説を否定できず、対立仮説が正しいとは判断できません。

なお、高校で学ぶ仮説検定は主に２種類あります。

①母比率の(仮説)検定
②母平均の(仮説)検定

この２種類の問題を経験することが大切です。

①「母比率の検定」のみを扱っている教科書もあります。
問題集を用いて②「母平均の検定」も取り組ませましょう。