最近の記事

テキストだけで画像編集:Prompt-to-Prompt 論文解説

Prompt-to-Prompt 論文解説、やっていきます。 私も初学者であり、説明が間違っていたり勘違いによる記述が含まれている場合がありますので、ぜひコメントなどをいただけたらありがたいです。 論文情報元論文 論文サイト 概要本論文は、テキストプロンプトの編集のみによる直感的な画像編集手法を提案しています。Stable Diffusionなどの大規模な画像生成モデルでは、プロンプトのわずかな変更でも全く異なる画像が生成されるという課題がありました。例えば、"公園で遊

    • 動きのあるT2V : MagicTime 論文解説

      動きのあるAnimateDiff、MagitTimeの論文を解説します。 私もまだ初学者であり、説明が間違っていたり勘違いによる記述が含まれている場合がありますので、ぜひコメントなどをいただけたら幸いです。 論文情報今回解説する論文はこちらです。 論文サイト 概要テキストから動画生成(T2V)の分野は急速に進化し、Animate Diffなど、テキストから高品質な一般動画を生成する技術が著しい成功を収めています。しかし、既存のモデルは現実世界の物理知識を十分にエンコード