見出し画像

SDXL 使用ガイド [Stable Diffusion XL]

SDXLが登場してから、約2ヶ月、やっと最近真面目に触り始めたので、使用のコツや仕様といったところを、まとめていけたらと思います。

(現在、とある会社にAIモデルを提供していますが、今後はSDXLを使って行こうかと考えているところです。)


SD1.5とSDXLの大きな違いはサイズです。

サイズ

推奨サイズをまとめます。

1024 x 1024 (1:1 正方形)
1152 x 896 (9:7)
896 x 1152 (7:9)
1216 x 832 (19:13)
832 x 1216 (13:19)
1344 x 768 (7:4 横長)
768 x 1344 (4:7 縦長)
1536 x 640 (12:5 横長)
640 x 1536 (5:12 縦長  iPhoneサイズに近い)

SDXLの基本サイズは 横1024 縦1024です。
学習をそのサイズで行っているため、このような推奨サイズになっています。

また、追加学習(fine-tuning)を行う場合も1024×1024で行うことが推奨されています。
Loraなども同じサイズが必要という認識です。


プロンプト

プロンプトに関しては、SD1.5で使用していたプロンプトで大丈夫なのかなという印象です。


まだ色々と試せていないので、現状の見解です。


SDXLの進化したところ

物体や、背景など、描写がかなり綺麗になった印象です。
また、人物に関してですが、最近かなりリアルな追加学習モデルが出てきた印象です。

(こちらの記事でダウロード数Top10のチェックポイントをまとめてます。⇩)

 二つ紹介します。


かなりリアル(というかほぼリアル)な画像を出すことができます。

次は、アジア人の女性はうまく出せるかというところですが、

simple white background
BREAK absurdres, best quality,
BREAK a woman with long hair and a white shirt, a picture, Fan Qi, full round face



このような女性を出すことができました。

様々なプロンプトを色々試せば、
美しい日本人のような女性も出せそうですね。



使用環境

AUTOMATIC 1111
WEB UI 1.6.0

Paperspace Gradientというクラウドサービスでマシンを
借りて使用しています。

今のところ、特に問題はなく使えています。たまに接続エラーが起きますが、WEB UI 1.6.0は個人的には使いやすいです。

Refiner

というものが追加されましたが、チェックポイントの中に既に含まれているものを使用するときは、Refinerは必要ありません。

最近のものは含まれているものが多い印象です。

ですので、私の場合、
推奨サイズに設定、ADetailerを設定し、画像を出力しています。
CGF スケールはチェックポイントによりますが、
3.5、4、4.5辺りをよく使っています。

また色々検証して、記事にまとめられたらと思います。







この記事が気に入ったらサポートをしてみませんか?