G検定 4-6 12 活性化関数（勾配消失問題解決する）

2024年12月8日 06:46

シラバス　12. 活性化関数　をまとめていきます

目標

・代表的な活性化関数の定義・使い分け
・注意点について、それぞれ説明できる
・ディープラーニングにおける活性化関数の役割を説明できる

Leaky ReLU 関数, ReLU 関数, tanh 関数, シグモイド関数, ソフトマックス関数, 勾配消失問題

【活性化関数の基本概念】

シグモイド関数　　　　　　　　　　　　シグモイド関数の微分

シグモイド関数の微分は最大値が0.25にしかなりません。隠れ層を遡るごとに（活性化関数の微分が掛け合わさって）伝播していく誤差はどんどん小さくなっていってしまいます。多くの隠れ層があると、誤差がほとんど０になってしまい、勾配消失問題が発生します。

シグモイド関数の改良版で、出力が-1から1の範囲に収束します。シグモイドよりも勾配消失の影響を受けにくいですが、依然として問題があります。

入力が0以上の場合はそのまま出力し、0未満の場合は0を出力します。計算が簡単で、勾配消失が起こりにくいため、最も一般的に使用される活性化関数です。

活性化関数の選択は、ニューラルネットワークの性能に大きな影響を与えます。モデルの目的やデータの特性に応じて適切な活性化関数を選ぶことが重要です。例えば、隠れ層にはReLUがよく使われますが、出力層ではタスクに応じてソフトマックスやシグモイドが選ばれることがあります。