pix2pixのメモ
GANの応用の中でも代表的なpix2pixについてのメモ
下記の記事で勉強していく。
Image to Image Translation
Conditional GANがベース
U-Netを採用し、入力画像の特徴を維持する
通常のGANのようにノイズを注入するのではなく、dropoutでバリエーションを作り出す。過学習抑制の目的もある?
DによるReal/Fakeの識別に加え、生成画像と正解画像がどれだけ似ているかを表す損失も必要
画像全体に対し、各ピクセルのL1距離の平均を加える
画像の局所パッチに対するL1距離の平均も加える(PatchGAN)
実装としては畳み込みとストライドでNxNを1x1にしてLossをとる