見出し画像

AuraFlow x ComfyUIを試してみた話

これはComfyUIのブログに記載されているものです。
デフォルトでAuraFlowに対応していると記載されています。

AuraFlowは現在、v0.2が公開されているようです。

AuraFlowはFlowベース生成モデルというもののようです。

これは拡散モデルというStablediffusionでよく使用しているものとは別な形式のモデルのようです。


上のHuggingfaceのサイトからダウンロードしてチェックポイントに配置すれば使えるようになります。
モデルの容量が17.5 GBと非常に大きいです。

実際に試してみた印象。

基本的に通常の画像生成と同じワークフローになっていましたので、画像生成に関しては違和感なく行うことができます。

これで見ると分かりますが、プロンプトの形式がSDXLとは少し、異なることが分かります。

プロンプト
a glass filled with glowing fizzy rainbow drink and a small red toy car on top of a table beside a juicy burger in the middle of a dark forest at night with a bear in the shadows in the background with the full moon

別なポニー系モデルで同じプロンプトで生成したもの

ということで、プロンプトの反映が高いことが分かります。

問題点としては、生成時間です。
モデルの容量が大きいことが影響していると考えますが、1024x1024の生成に60秒ぐらいかかります(Paperspace A4000)。

おそらくNSFW的なものは対応していないのではと思います。

AuraFlowのプロンプト追従性は高く、pony系などで対応が難しいものも生成できそうです(SFW系)。
例えば以下のようなものだと、pony系は厳しいですが、AuraFlowだと複数回のガチャは必要ですが生成出来ました。

A young girl playing baseball. The girl swinging a bat with both hands and hitting a ball. she gaze at a ball. in a park with sunny day. She wears baseball uniform. She is slender and has cute and beautiful face. normal anatomy.




この記事が気に入ったらサポートをしてみませんか?