最近の記事
It’s All About Your Sketch: Democratising Sketch Control in Diffusion Models
拡散モデル(Diffusion Models)を使った画像生成において、スケッチを制御する手法を提案しています。従来の手法では、エッジマップのような正確なスケッチが必要でしたが、この研究は、素人のフリーハンドスケッチでも高精度な画像を生成できるようにすることを目的としています。 主な貢献として、次の3つが挙げられています: スケッチコントロールの民主化:フリーハンドスケッチからでも高精度な画像を生成可能にする。 抽象度に対応したフレームワークの導入:テキストを使わず、抽
Diffusion Model Alignment Using Direct Preference Optimization
この論文では、Diffusion-DPOという新しい手法を提案しています。これは、テキストから画像を生成する拡散モデル(Diffusion Models)において、人間の好みに合わせて直接最適化を行う方法です。この方法は、最近の言語モデル(LLMs)で使われている「人間のフィードバックに基づく強化学習(RLHF)」の代替となるもので、シンプルに人間の比較データを利用してモデルを調整します。具体的には、「Direct Preference Optimization (DPO)」
Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models
この論文では「Smooth Diffusion」という新しいモデルが提案されています。このモデルは、画像生成を行う際に「スムーズな変化」を実現することを目的としています。通常、既存の「Stable Diffusion」などのモデルは、少しの入力変化で大きな画像の変化が起こることがあり、それが問題とされています。この新しいモデルは、入力の変化が滑らかに画像に反映されるようにし、画像生成の質を向上させることを目指しています。 具体的には、3つのタスクでの改善が示されています: