SDXL 使用ガイド [Stable Diffusion XL]
SDXLが登場してから、約2ヶ月、やっと最近真面目に触り始めたので、使用のコツや仕様といったところを、まとめていけたらと思います。
(現在、とある会社にAIモデルを提供していますが、今後はSDXLを使って行こうかと考えているところです。)
SD1.5とSDXLの大きな違いはサイズです。
サイズ
推奨サイズをまとめます。
1024 x 1024 (1:1 正方形)
1152 x 896 (9:7)
896 x 1152 (7:9)
1216 x 832 (19:13)
832 x 1216 (13:19)
1344 x 768 (7:4 横長)
768 x 1344 (4:7 縦長)
1536 x 640 (12:5 横長)
640 x 1536 (5:12 縦長 iPhoneサイズに近い)
SDXLの基本サイズは 横1024 縦1024です。
学習をそのサイズで行っているため、このような推奨サイズになっています。
また、追加学習(fine-tuning)を行う場合も1024×1024で行うことが推奨されています。
Loraなども同じサイズが必要という認識です。
プロンプト
プロンプトに関しては、SD1.5で使用していたプロンプトで大丈夫なのかなという印象です。
まだ色々と試せていないので、現状の見解です。
SDXLの進化したところ
物体や、背景など、描写がかなり綺麗になった印象です。
また、人物に関してですが、最近かなりリアルな追加学習モデルが出てきた印象です。
(こちらの記事でダウロード数Top10のチェックポイントをまとめてます。⇩)
二つ紹介します。
かなりリアル(というかほぼリアル)な画像を出すことができます。
次は、アジア人の女性はうまく出せるかというところですが、
このような女性を出すことができました。
様々なプロンプトを色々試せば、
美しい日本人のような女性も出せそうですね。
使用環境
AUTOMATIC 1111
WEB UI 1.6.0
Paperspace Gradientというクラウドサービスでマシンを
借りて使用しています。
今のところ、特に問題はなく使えています。たまに接続エラーが起きますが、WEB UI 1.6.0は個人的には使いやすいです。
Refiner
というものが追加されましたが、チェックポイントの中に既に含まれているものを使用するときは、Refinerは必要ありません。
最近のものは含まれているものが多い印象です。
ですので、私の場合、
推奨サイズに設定、ADetailerを設定し、画像を出力しています。
CGF スケールはチェックポイントによりますが、
3.5、4、4.5辺りをよく使っています。
また色々検証して、記事にまとめられたらと思います。
この記事が気に入ったらサポートをしてみませんか?