データサイエンス勉強用メモ_重回帰分析

重回帰分析でのp値と帰無仮説の棄却

重回帰分析とは、何かを予測するときに複数の要素を使って予測する方法です。例えば、テストの点数を予測するときに、勉強時間や睡眠時間などを使って予測するような感じです。

帰無仮説とは、「予測に使う要素は関係ないですよ」という仮定のことです。

**有意水準(α = 0.05)**は、「どれくらいの確率でこの仮定を間違うか」を表します。0.05は「5%」の意味で、「5%以下の確率なら間違いじゃないよ」と判断します。

p値は、「この要素が関係ない(帰無仮説が正しい)場合に、このデータが出る確率」を示しています。


具体的な例

  1. 帰無仮説

    • 「勉強時間はテストの点数に関係ない」

  2. 有意水準

    • 0.05(5%)

  3. p値

    • 実際のデータを使って計算した結果が「0.03」

判断の仕方

  • p値が0.05未満(この場合、0.03)なら:

    • 「この要素(勉強時間)は関係ない」という仮定は間違いだと考えます(帰無仮説を棄却)。

    • つまり、「勉強時間はテストの点数に関係ある」と言えます。

  • p値が0.05以上なら:

    • 「この要素(勉強時間)は関係ない」という仮定を受け入れます(帰無仮説を受け入れる)。

    • つまり、「勉強時間はテストの点数に関係ないかもしれない」と言えます。

まとめ

  • p値が0.05より小さい場合、要素(例えば、勉強時間)は結果(例えば、テストの点数)に関係あると言えます。

  • p値が0.05以上の場合、その要素は結果に関係ないかもしれないと言えます。

いいなと思ったら応援しよう!