統計検定準1級ワークブック どこまでやったの 第16章
統計検定準1級ワークブック(以下WB)の「第16章 重回帰分析」について、私がどこまで勉強をやったのかを書いていきます。
準1級は範囲が広いので、どの章をどの程度勉強したのかは気になるところだと思います。本記事が同資格を受験する方の参考の1つとなれば幸いです。
重回帰分析
重回帰分析の公式まではいいのですが、そこから行列での計算が始まり、最小二乗推定量を求め、最終的には「総変動=回帰変動+残差変動」というシンプルな式に収まります。
この辺りの理論はもちろん理解して進めた方がいいことは分かっていますが、いったん後回しにした感じです。
自由度調整済み決定係数の計算式が載っていますが、こんなに難しかったっけと思わせるものがあります。導出できればよいので私は以下で覚えました。
$${R^{*2}=1-\frac{n-1}{n-k-1}(1-R^2)}$$ ※kは説明変数の数
最小二乗推定量の性質が3つ載っていますが、なんとなく覚えただけで深くは理解できていません。
重回帰分析の検定
ここもなんか難しいことが書かれています。結局のところ重回帰分析の分析結果のF-statisticのp-valueで有意差検定しているだけだと思い、スルーしました。今読み返しても意味不明です。。
最後にAICについて書かれていて、「第30章 モデル選択」を勉強した後で返ってくることになります。
正則化
ここはWB本文をパッとみて「分からない!」となったので、先に「予備校のノリで学ぶ「大学の数学・物理」」さんの動画を見た記憶があります。
・L1/L2正則化の意味【機械学習】
https://www.youtube.com/watch?v=3vfiMRjgzZ8
こんな感じでWB本文の説明は本当に難解なので、まずはザックリ理解してから、ちょっとずつWB本文の分かる範囲を広げていく方法がよいと思っています。
どうでもいいことかもですが「L1がLasso」「L2がリッジ」「らりるれろの順」「真ん中がElastic-Net」みたいな感じで覚えてました。勉強の終盤ではどういう場合がL1で、L1にはどういう欠点があって、といったところまで結構細かく理解しました。
「Fused lasso」はスルーしました。
WB本文と例題の関連性
関連性はかなり低いと思います。WB本文では理論について書かれていますが、例題では分析結果の読み取りがメインとなっています。
WB本文と例題の内容が最も乖離している章だと思います。執筆者の意図は読み取れませんでした。。
例題については別記事に書いています。ご参考まで。
どこまでやったの?
どこまでやったの度:★☆☆
あまりやりこんではいないですが、例題の数が少ないので重回帰分析については2級の過去問で補強した感じです。
試験対策としては分析結果の読み取りだけで足りるような気もしますが、準1級持ってるのに本質分かってないの?と試されている気もします。実務等で使う場合はそれでも十分だと思いますが、なんか気持ち悪いです。。
なお、以下にまとめ記事を書いております。こちらもお役に立てば幸いです。