見出し画像

G検定 5-1 18. 畳み込み層

シラバス 18. 畳み込み層 についてまとめていきます

目標

・畳み込み層の基礎的な知識を理解する
・全結合層と畳み込み層の差異について、説明できる
・畳み込み層の役割について説明できる
・畳み込み層のパラメータ数について理解する
・畳み込み層が適用できるデータの特性について理解する

キーワード

Atrous Convolution, Depthwise Separable Convolution, Dilation Convolution, カーネル,ストライド, 畳み込み操作, 畳み込みニューラルネットワーク (CNN), 特徴マップ, パディング, フィルタ

Feloで作成

【畳み込み層の基本概念】


■畳み込み層の基本

・画像認識に特化した層構造
・局所的な特徴を抽出
・パラメータ数を削減可能

■主要な要素

畳み込み層の処理(convolution)

  • フィルタ(カーネル)を使う

  • 特徴を検出する小さな行列

  • エッジや模様などのパターンを検出

  • サイズは通常3×3や5×5

  • 特徴マップのサイズが小さくなる

パディング処理

  • 入力と同じ特徴マップにしたい時に使用

  • 入力データの周りに追加する余白

  • 出力サイズの調整に使用

ストライド

  • フィルタの移動幅

  • 大きいほど出力サイズ(特徴マップのサイズ)が小さくなる

■全結合層との違い

・パラメータ数が少ない
・位置の変化に強い
・画像の空間的特徴を保持

■発展的な手法

広い範囲の情報を集約するには、フィルタサイズを大きくしても良いが、計算量と学習するパラメータ数が増えてしまいます。

Atrous Convolution (Dilation Convolution)

  • 直訳すると、、、拡張畳み込み

  • フィルタの間隔を空けて畳み込み

  • 広い範囲の特徴を効率的に捉える

  • DeepLabのニューラルネットワークで使われる

Depthwise Separable Convolution

  • 直訳すると、、、奥行き方向に分離可能畳み込み

  • 空間方向とチャネル方向に対して独立に畳み込み処理を行う

  • 空間方向はDepthwise Convolutionは特徴マップのチャネル毎に畳み込み処理を行います

  • チャンネル方向はPointwise Convolutionは1×1の畳み込み処理を行う

  • 計算量を削減

  • モバイル向けに最適化

  • 通常の畳み込み処理の近似計算なので、精度は一致しません

  • 通常の畳み込みと同様に、ネットワーク内に複数回配置することができる

■適用データ

・画像データ
・時系列データ
・空間的な構造を持つデータ

ディープランニングの各種層

いいなと思ったら応援しよう!