AI で本物っぽい画像を捏造するやつ
本当は存在しない画像を生成するアルゴリズムについて、の書きかけ。
セレブの顔写真コレクションをトレーニングに使って、元々のセットの中に存在しなかった新しいリアルな顔写真(に見える)画像を作るやつとか。
識別モデル
マシンラーニングの多くは識別モデル(Discriminative model)で、入力データを識別、分類する目的で使われる。画像を入力するとそれがゴッホの絵っぽいか、それともマティスの絵っぽいかを返してくるようなやつが識別モデル。猫が画像の中にいるかな、とか。
Discriminative modeling estimates p(y|x) - the probability of a label y given observation x.
識別モデルは観測データ(observation))x がラベル y に属する確率を推定する。
例:ラベル「猫」の確率90%、「犬」の確率48%。
なので識別モデルのトレーニングにはラベルのついたデータセットを使う。
生成モデル
画像をでっち上げる奴は生成モデル(generative model)と呼ばれる。別に画像でなくても、文章でも音楽でも良いのだが今の所画像が一番多いし上手くいっている。
大量の猫の画像を学習したモデルが、学習に使っていない新しい猫の画像を作れるようになるのが生成モデル。
例えばオートエンコーダーというアルゴリズムを応用すると、学習した画像を圧縮して空間にべったり並べたようなものを作り出すことができる。この空間から一点をサンプリングすると元の画像セットの特徴を持った新しい画像を取り出すことができる。ざっくりいうと大量の猫の画像を学習したオートエンコーダーからは元のセットには存在しない新しい猫(に見える)画像を取り出すことができる。