G検定 4-3 14. 正則化

2024年12月3日 19:10

シラバス　14. 正則化　についてまとめていきます

目標
・正則化を導入する目的を説明できる
・代表的な正則化手法の特徴を説明できる
・獲得したいモデルの特性に応じて、適切な正則化手法を選択できる

キーワード
L0 正則化, L1 正則化, L2 正則化, 正則化, ドロップアウト, ラッソ回帰, リッジ回帰

G検定シラバスより

正則化 (Regularization)

特徴の重みの絶対値の和をペナルティとして加えることで、モデルの重みの一部をゼロにします。
不要なパラメータを削減できます
ノルム (Norm)に対応（ベクトル（数の集まり）の大きさを測るための指標）
ラッソ回帰 (Lasso Regression)
- L1正則化を用いた線形回帰手法で、不必要な特徴を自動的にゼロにします。
- モデル選択に役立ちます。

ディープニューラルネットワーク（DNN）における正則化手法の一つで、過学習（overfitting）を防ぐために使用

モデルが学習中に特定のニューロンに過度に依存することを抑え、
多様性を向上させるのが目的

トレーニング中:
- 各エポック（訓練の1周）またはミニバッチで、一定確率 ppp（ドロップアウト率）の割合でニューロンを無効化します（ランダムに選択し、その出力を0にします）。
- この操作により、ネットワークは常に異なるサブネットワーク（縮小されたネットワーク構造）で学習します。
推論（テスト）中:
- ドロップアウトは適用されません。
- 代わりに、全てのニューロンを使用し、それらの出力値を学習時のドロップアウト率に応じてスケーリング（通常は 1−p1-p1−p を掛ける）します。

過学習の抑制:
- 特定のニューロンやパラメータに依存しにくくなり、モデルの汎化性能が向上します。
アンサンブル学習:
- ドロップアウトによるランダムなニューロンの無効化は、複数のモデルをランダムに作って学習することに相当し、実質的なアンサンブルモデルの効果を得られます。