![見出し画像](https://assets.st-note.com/production/uploads/images/153810340/rectangle_large_type_2_1ef74cbdc607f97c54650a5d3d363a80.png?width=1200)
複雑な画像生成はComfyUIが便利
前回の記事にてComfyUIを使って画像生成を説明しました。一見使いづらそうですが、ComfyUIの便利な機能を説明します。
SDWebUIとComfyUIの比較
Stable Diffusionで単純な画像生成をする場合、Stable Diffusion WebUI(以後、SDWebUI)が一般的であり、ユーザビリティが高いと言えます。Text To ImageやImage To Imageもタブ切り替えで利用できます。
例えば、赤リンゴの画像を同じ構図の緑リンゴの画像を生成するとします。いくつかやり方はありますが、今回はControlNetのDepthを利用した画像生成をします。Depthとは深度の情報を得る機能で、インプット画像の奥行き(構図)情報を取得することが可能です。
(事前の設定は必要ですが)SDWebUIはほとんど操作をせずに画像生成することができます。一方、ComfyUIはノーコーディングではあるものの、ノードの組み立てが必要で、適切にノードを接続しないと画像生成をすることができません。
![](https://assets.st-note.com/img/1725935091-qWh0BDvRlF3VpdCT2iSJ5xHN.png?width=1200)
![](https://assets.st-note.com/img/1725935183-g9zwX1pBjuxNqb3C87l5RtWo.png?width=1200)
ControlNetのDepthは↓の通りです。
ConfyUIの便利な機能
では、SDWebUIよりComfyUIが便利だと思う点について説明します。
まずは、複数のノードを組み合わせて画像生成ができる点です。例えば、2つの画像を合成し、1枚の画像生成をすることができます。
例えば、2つの赤リンゴ画像(①-1、②-1)をインプットにDepthで深度を取ります(①-2、②-2)。その深度を取った画像を組み合わせて、プロンプト「green apple」を入力すると2つのリンゴが重なった緑リンゴの画像が生成されます(③-1)。
その深度を取ると(③-2)、②-1に①-1のツル(果梗)が合成されています。現実的には存在しないリンゴですが、割と自然な画像生成ができました。
![](https://assets.st-note.com/img/1725941822-BnLscaibq0jDKYVt1gTxWFGr.png?width=1200)
![](https://assets.st-note.com/img/1725945005-IoTaqtAh9mO3RY2r4H1QDBWd.png?width=1200)
もう1点、カスタマイズノードが豊富な点です。上記のControlNetもこちらの画面からダウンロードできます。Titleのリンクを押下すると対象のGithubの画面に遷移します。様々なノードを組み合わせることで、SDWebUIではできなかった画像生成をすることができます。次回、別の例で説明しようと思います。
![](https://assets.st-note.com/img/1725944522-FeHuczJbUV73GgvMNp0PakRh.png?width=1200)
![](https://assets.st-note.com/img/1725944530-N7cWehBwEfqFAJIgP2dmbX5Z.png?width=1200)