データサイエンス勉強用メモ_重回帰分析
重回帰分析でのp値と帰無仮説の棄却
重回帰分析とは、何かを予測するときに複数の要素を使って予測する方法です。例えば、テストの点数を予測するときに、勉強時間や睡眠時間などを使って予測するような感じです。
帰無仮説とは、「予測に使う要素は関係ないですよ」という仮定のことです。
**有意水準(α = 0.05)**は、「どれくらいの確率でこの仮定を間違うか」を表します。0.05は「5%」の意味で、「5%以下の確率なら間違いじゃないよ」と判断します。
p値は、「この要素が関係ない(帰無仮説が正しい)場合に、このデータが出る確率」を示しています。
具体的な例
帰無仮説:
「勉強時間はテストの点数に関係ない」
有意水準:
0.05(5%)
p値:
実際のデータを使って計算した結果が「0.03」
判断の仕方
p値が0.05未満(この場合、0.03)なら:
「この要素(勉強時間)は関係ない」という仮定は間違いだと考えます(帰無仮説を棄却)。
つまり、「勉強時間はテストの点数に関係ある」と言えます。
p値が0.05以上なら:
「この要素(勉強時間)は関係ない」という仮定を受け入れます(帰無仮説を受け入れる)。
つまり、「勉強時間はテストの点数に関係ないかもしれない」と言えます。
まとめ
p値が0.05より小さい場合、要素(例えば、勉強時間)は結果(例えば、テストの点数)に関係あると言えます。
p値が0.05以上の場合、その要素は結果に関係ないかもしれないと言えます。