Stable Diffusionの自分なりの使い方
始めてみたのはいいものの色々困ったことがあったんで解決策をメモしとく。google版はしらん。
2Dキャラ用モデルおすすめ
おすすめっていうほど分かってないけど、自分はアメリカンな感じとか超美麗な感じのツヤツヤ系(イラスト系?)2Dが苦手なのでこれ使っているっていうものをいくつか。かわいい感じとか幼い感じが出せる。他にお勧めあれば是非教えてほしい。
Loraってなんや
追加データとかDLCみたいなもん。多分。
普通のモデル内には当然特定のキャラクターのデータなんて入っていないので、好きなアニメキャラとか出したいならLora(LycoRis)モデルを入れる。
AI画像サイトとかでくそかわ女の子が生成されてたりする時は大体オリジナルLora使ってる。そして泣く。
txt2imgとかのタブ内の真ん中くらいにあるタブにloraっていうところがあるので、loraをあらかじめCivitaiとかからダウンロードしてsd.webui\webui\models\Loraディレクトリ(フォルダ)に入れておく。
入れたらloraタブの右側とかにある更新してくれそうなボタンを押すとLoraの一覧が更新されるので、あとはそのLoraのサムネイルをクリックするとプロンプトにLoraのタグが入る。
このタグとトリガータグ(配布ページの説明欄とかcivitaiなら右側のTrigger Wordsっていうやつ)の2つをプロンプトに入れないと多分Loraが効かず普通に別のキャラが生成されちゃう。
毎回起動するたびにプロンプトとか設定を1から入れなおすの面倒
自分はimages browserっていうextensionを入れて解決した。
これ入れると自分が過去生成した画像一覧がビューワ形式で見れるんだけど、画像を表示すると生成時の情報が表示されて、txt2imgとかに一発でインポートしてくれるボタンがある。
これで毎回気に入った生成画像を選んでそこからまた次の生成をはじめるっていう感じでやってる。
それまではAI画像サイトとかで拾ってあった画像とかをpng infoに突っ込んでプロンプト拾ったりしてたんだけど、大概独自Loraとか拡張プロンプトとかでどうにも面倒だったのでこの方法になった。
そもそも設定を保持する項目とかどっかにありそうなもんだがよくわからんのでこれでいいやって感じ。
extension入れたのにタブが出てこない
多分コンソール画面(起動時に出てくる真っ黒の背景にプログラムっぽい文字が出てるやつ)にエラーが出てると思う。何かいてあるかわかんないっていうならchatgptにでも食わせて解説させれば良し。
あと、Apply and Restart UIっていうクソデカオレンジボタンを押してないっていうことはないか?
それでも動かないならextension自体が本体のバージョンアップについていけてないとか。この場合はあきらめるしかない。
髪色や髪型やロケーションなどをランダムでプロンプトを出力する
髪色や髪型やロケーションなど毎回生成するたびに変わってほしいなーと思うときはdynamic promptというextensionを導入する。
これ使うと{red hair | blue hair | yellow hair}みたいにかけて、この場合赤・青・黄の3色からランダムで1つ選ばれて生成される。
あと、テキストファイルにまとめておいたプロンプト一覧から1つランダムに選んで生成に使ってくれるっていう便利な機能もある。こっちがめっちゃ便利。hair_style.txtとかにbobとcurly hairとかいっぱい書いておけば__hair_style__っていうプロンプト1個でどれかが選ばれるので、毎回生成するたびに違った髪型の女の子が出てきてくれる。
こういう感じで髪型や髪色や表情や体型やポーズやアングルとかロケーションとか、そういうのをそれぞれテキストファイルにまとめておけば、
__hair_style, __hair_color, __expression__, __body_shape__, __pose__, __angle__, __location__
って書くだけでいろんな女の子がいろんな場所でいろんなポーズしたものが生成されるわけ。あとはバッチ回せば思いがけない良い組み合わせの画像が生成できたりする。
このファイルはcivitaiとかで配ってる人もいるので探してみるといい。
気に入った子ができたから別のポーズとかシチュエーションさせたい
controlnetっていうextensionがあるんで、それを使えば結構同じっぽい子が出せる。referenceにしてプロンプトの外見部分を変更しなければ大体同じ感じの子が出てくる。
さっきのランダム生成を大量にやって、気に入った子が出てきたらこれ使っていろんなシチュエーションの画像を生成するとかをよくやってる。
連続で何枚も生成してほしい
batch countがその設定やで。
生成した画像どこ?
sd.webui\webui\outputsの中にあるフォルダのどっか。
プロンプト入れるの面倒
easy prompt selectorっていうボタン1つでプロンプトに入れられるextensionがあるよ。
このextensionはyamlっていう形式のテキストファイルにボタン名とそのボタンで入れたいプロンプトを書いておけば、ボタンを押すだけで最後尾に勝手にそのプロンプトを追加してくれる。
これとdynamic promptを組み合わせれば、ボタン1つでランダム生成タグを入れられるのでちょっと便利。
ただしyamlのファイルが1つでも壊れてる(変なタブ入ったりスペースの数が違うとか)と、このextensionのタブ自体が出てこなくなるので注意。コンソール画面見れば起動時にエラー出てるはず。
yamlの書き方わかんないならchatgptに書いてもらえばいいよ。
生成画像サイズ
多分512x768が主流?アスペクト比2:3になるからじゃないかな。しらんけど。自分はそれにhires.fix設定して2倍にしてる。
2girlsにしたのに1人しか出てこない
2人目のキャラが入るだけの横幅が足りてないと出ないような気がする。横長画像で生成すれば出やすくなると思う。
loraのトリガーワードいちいち覚えるの面倒
だったので、civitai helperっていうextension入れた。これインストールしてスキャンするとトリガーワードを勝手に探して入れてくれるボタンが追加されるのでよく使ってる。
まあeasy prompt selectorのyamlにトリガーワード入れておいてボタンぽちーでやるのがよさそうな気もするけど。