見出し画像

【生成AI初心者向け】これ知ってないと詰む stable diffusionの基礎知識

前置き

これはsdxl環境下での解説です。
アップデートされたらこの解説は通用しない可能性が高いです。
生成AI初心者用記事です。

sdxlって何?

正式名称はStable Diffusion XL。
animagineXLやPony Diffusion V6 XL等の有名なモデル(チェックポイント)は聞いた事があると思います。
このモデルはこのsdxlをベースにして作られています。
ベースモデルは開発するのにお金が沢山要るので企業が開発している事がほとんどです。
今有名なベースモデルを新しい順に並べると、

sd3.5
flux
sdxl
sd1.5

といった所でしょうか。
現状、sdxlをベースにしたモデルを使用するのが主流となっています。

モデル(チェックポイント)って何?

stable diffusionの赤枠でくくった部分で切り替えて使うことが出来るやつ。
animagineXLやPony Diffusion V6 XLとかの事。
civitai や Hugging Faceで手に入れられます。
モデルによって出る絵柄が違います。

pony


animagine

ちなみにpony系はプロンプトの書き方がとても複雑です。ちゃんとしたプロンプトを入れないと崩壊しがちな生成画像が出来上がります。
つまり、モデル(チェックポイント)ちゃんと説明文を読んでからモデルを使用しないと上手く使いこなせないということです。

モデルダウンロードはstability matrix上でするのが無難です。

Lolaって何?

点目

モデルだけだと出にくい表情などLolaを引っ付ければ出やすくなります。
トリガーワードを入れると更に強く効果が出る場合があります。
そして注意するべき点としてはanimagine用に作ったLolaをponyモデルに使っても効果が弱いという点です。逆も同じです。
エラーは吐きませんが、sd1.5用に作ったLolaをsdxlのモデルで使おうとしても全く効果がありません。
ベースモデルがsdxl同士なら一応互換性が有ります。でも全く別物と言って良いほどLolaの効きが違います。
モデルもそうですが、説明文をよく読んでLolaを使わないと使っても効果がないと言うことです。

ちなみにlolaやモデルにも利用規約があります。自分で調べて自己責任で使用してください。

https://civitai.com/

コンソール

何か生成AIがうごかない…と言った時はstability matrixのコンソールを見るべきです。
英語がいっぱい書かれていて疲れると思いますが、コンソールにエラーがある場合それを検索して自己解決するしかありません。

生成ボタン押したのに全然動かない!滅茶苦茶な画像が出る!

生成aiは大きすぎる画像(3000px×3000px等)や小さ過ぎる画像を生成しようとすると絵が壊れます。
劣化した絵が出たらピクセル数は適正かを疑いましょう。
1024×1024pxが基準のサイズです。


いいなと思ったら応援しよう!