変分オートエンコーダ④連続潜在変数とは
前回は、有向確率モデルについて解説しました。
今回は、変分オートエンコーダ(以下、VAE)の有効確率モデルで扱う連続潜在変数(Continuous Latent Variables)について解説します。また、VAEがエンコーダ・デコーダを使ってどのように連続潜在変数を抽出し画像生成に役立てるのかについての大枠も説明します。
なおVAEのエンコーダ・デコーダの構造は、以前の記事で扱ったノイズ除去オートエンコーダにも似ています。ただし、ノイズ除去のオートエンコーダでは、画像を生成することはできませんでした。
しかし、同じようなエンコーダ・デコーダの構造を持つVAEでは画像を生成することが可能です。その理由もこの記事を読むと理解できます。
では、さっそく始めましょう。
エンコーダ・デコーダ
すでに、何度か言及しましたが、下図はVAEの論文で登場するDAG(有向非巡回グラフ、Directed Acyclic Graph)です。
上図はエンコーダとデコーダの2つのDAGを表現しているので、慣れていないと複雑に見えるかもしれません。よって、図を二つに分解して解説します。
この記事が気に入ったらサポートをしてみませんか?