【統計学はこんな学問だ!!】仮説検定編
はじめに:仮説検定で分かること
あなたはビジネスマンだとします。新事業を立ち上げ、売上が増えたとします。とても素晴らしいことですが「ただの偶然だよ」と言われたらいやですよね。新事業のおかげで売上が伸びたといいたいですよね。実は、統計学で学ぶことができる仮説検定というものを使うと、「新事業のおかげ」と言えるのです!!
標準偏差2つ分離れると、4.6%と非常に稀な確率が起きるという統計の性質を利用することで、検定を行えます。「ただの偶然」である確率が限りなく低いなら、「必然」になりますよね。そのような考え方を利用します。標準偏差などの理解が曖昧な場合は前回の内容を見てもらえると助かります。
理由:標準偏差×2ぐらい離れると。。。?
仮説検定というものは、「新薬のおかげで平均体重が減ったのか」「広告を出したら売上はあがったのか」「補習授業を受けたおかげで成績が伸びたのか」などといった、データの増減に影響を与えているのかを突き止めることが分かります。
必要な知識は、標準偏差 2 つ離れていると可能性は限りなく低いということです。2つ離れていれば、$${100\% -95.4\% = 4.6\%}$$で起きる確率は 4.6%しかないということです。
もしも、「従来の平均」から「新しく計算した平均」が標準偏差 2 つ分離れていれば、従来の分布において「新しい平均」が起こる確率はとても低い(4.6%) ことになります。すなわち、従来の分布から別の分布へと変化したと分かるのです。
従来通りの仮定を否定することで、新しいことの効果を証明をします。否定の否定をすることで肯定するイメージです。そのため、仮説検定で立てる仮説は否定したい仮説を置きます。無かったことに帰すことから、帰無仮説と呼ばれます。
ここで、仮説検定の流れをざっくり説明します。
本当は、検定統計量とか棄却域などといった難しい概念を使いますが、ここでは割愛します。
具体例:例題で確認
これは仮説検定の一例であり、実際のデータや検定手法は研究の対象や目的によって異なります。
まとめ:検定のやり方はこれだ!!
標準偏差 2 つ分離れているかを確認することで、「確率的にそれはないだろ」と考え証明する。これが検定の流れです。
統計学は標準偏差を 1 にデータを変換させる操作をします。標準化というのですが、これを利用して平均値が離れているなどの話をします。そのため、本当は複雑な計算をします。
これは平均値の検定だけではなく、比率や分散の検定を行うこともできます。また、使う分布も正規分布以外に「$${\chi^2}$$分布、$${t}$$分布」など場面に分けて様々あります。
大学で学ぶ統計学の入り口を 5回にわたってこれまで紹介してみました。興味を持っていただけるとありがたいです。最後まで見ていただきありがとうございました。