G検定 6−1 25. データ拡張
シラバス 25. データ拡張 をまとめていきます
目標
・データ拡張の基礎的な知識を理解する
・代表的なデータ拡張手法について理解する
・ディープラーニングにおけるデータ拡張の役割を説明できる
・タスクやデータセットに応じて、使用するデータ拡張手法を選択できる
キーワード
Contrast, Brightness, Crop, CutMix, Cutout, Mixup, noising, paraphrasing,
RandAugument, Random Erasing, Random Flip, Rotate
基本概念と役割
データ拡張とは
モデルの訓練に使用するデータセットを人工的に増やし、多様性を持たせるテクニック
モデルの性能を向上させ、過学習を防ぐ目的で利用されます
データ拡張の役割
データのバリエーションを増やすことで、より一般化されたモデルを作成する
限られたデータセットからでもモデルを効果的に学習させられる
代表的な手法と選択
代表的なデータ拡張手法について理解する
Paraphrasing(言い換え)
テキストデータの異なる表現を生成し、意味の多様性を提供
データの一部を別の値に入れ替える
Cutout
画像のランダムな部分を黒くし、隠すことで不変な特徴を学習
データの一部分の値を0にする
データの一部分を遮蔽したようなデータを擬似的に生成することに相当
Random Erasing(ランダム消去)
画像の一部をランダムに除去し、特徴の頑健性を向上
Mixup
ラベルをウェイト付きでミックスし、異なるサンプル間の滑らかな遷移を学習
2つのデータを合成。存在しないデータを擬似的に生成することに相当
CutMix
2つ以上の画像を部分的に混ぜ、新しいサンプルを生成
CutoutとMixupの組み合わせ、組み合わせ次第で様々な方法
RandAugment
適応度を調整可能なランダムかつ多様な拡張を適用
データ処理をどのくらいの強さで行えば良いか自体を学習により決める
Contrast(コントラスト調整)
画像のコントラストを変化させ、特徴を強調
Brightness(明度調整)
画像の明るさを調整して異なる照明条件をシミュレーション
Crop(トリミング)
画像の一部を切り取ることで、異なるアングルをシミュレーション
Noising(ノイズ追加)
ランダムノイズを加え、モデルがノイズに強くなるよう促す
Random Flip(ランダム反転)
画像を左右/上下に反転し、対象の向きに対する頑健性を向上
Rotate(回転)
画像を一定角度で回転し、異なる視点を学習
タスクやデータセットに応じて、使用するデータ拡張手法を選択できる
画像処理タスクでは明度調整や反転など、テキストでは言い換えなど用途に応じて選択
やみくもに全ての処理を施さないように注意が必要。(例えば親指が上げているでいいね!逆さにすると別の意味に)