便利な拡張機能!StableDiffusion WebUIの拡張機能を初心者が導入した
正直あんまり理解していないWebUIの機能
とりあえずimage画像をだしたくてはじめたStableDiffusionですが、あまり機能の意味をわかっていないので明確にしておきます。
WebUIの機能
今私がたくさん使っているのは txt2img 部分ですが、他にもたくさんのことができます。ひとまず上部のメニュー内を調べます。
txt2img:テキストから画像生成
img2img:アップロードした画像を元に画像生成
PNG info:画像から数値やプロンプトを知ることができる
Checkpoint Marger:モデルを組み合わせてオリジナルモデルを生成し、元のモデルに応用を加えられる
Train:画像を学習させてオリジナルモデルの作成ができる
Setting:StableDiffusion自体の設定
Extensions:拡張機能をインストールしたりできる
よく使う部分の機能を知る txt2img
拡張機能を追加しています。日本語化してるせいで分かりづらい部分もあるので明確にしていきます。
①table Diffusion checkpoint
モデルを設定する
②SD VAE
StableDiffusionのVAEの設定。モヤモヤしている画像をハッキリさせる
③Clip skip
プロンプトどおりに画像を生成させる値。数字が小さい方がプロンプトどおりの画像が生成される。おおきければプロンプトを無視した画像を生成する
④Sampling method
画像生成する時のアルゴリズム
⑤Sampling steps
生成する回数。数字が大きければ詳細になるが、生成に時間がかかる
⑥Hires.fix
高画質で生成(アップスケーラーとか設定できる)
⑦Width/Height
生成される画像の大きさ(単位はpx)
⑧Batch count
バッチ回数。同じ条件で画像を生成する枚数
⑨Batch size
1つのプロンプトに対して同時に画像を生成する枚数
⑩CFG Scale
芸術性とプロンプトの比重。値が大きいほどプロンプトに忠実になる
30まで設定できるが、6~14くらいが最適っぽい
⑪seed
生成した画像にランダムに振り分けられる値
seedって何?
ここで私が一番わからなかったのがseedという値。
ランダムに振り分けられるからなんなのさ?と思ってたんですが
seed値を使えば同じキャラを作ったり高解像度化することができるようです。ここがよくわからないので後日深堀ります。
拡張機能について
便利な拡張機能が色々あるのでメモしておきます。
StableDiffusion日本語化
日本語化されますが、英語もちゃんと表示されるので原文をのこしてくれて便利です。
txt2img 等があるタブの一番右の「Extensions」を開き、その中のタブ「Available」をクリックします。
上記のページにたどり着いたら下記のコードを「Load from」ボタンの右窓に入れます。
このとき、ボタン下にある「Hide extensions with tags」の「localization」のチェックボックスは外して「Load from」をクリック。
https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui-extensions/master/index.json
すると、一覧が出てくるので「ja_JP Localization」をみつけて Install します。その後、「Setting」タブの「User interface」の中の
「Localization」(下の方にあります)を「ja_JP 」に変更。
最上部の「Apply settings」をクリックして「Road UI」をクリックすると日本語化が適用されます。
ポーズの指定:ControlNet
ControlNetという拡張機能でポーズの指定ができます。
ポーズだけ固定して微調整をする時等に便利です。
ControlNetに関しては↓で実験しました。
プロンプトを解析する:tagger
画像を解析してプロンプトを推測したりできる機能です。
日本語化したときの「Available」(拡張機能リスト)に移動して「Load form」(読込)ボタンを押すと一覧が出てくるので「WD 1.4 Tagger」と検索してインストール。
使い方は別で勉強します。
プロンプトサジェスト機能:a1111-sd-webui-tagcomplete
プロンプトをサジェストで出してくれる機能です。めっちゃ便利。
知らないプロンプトを知る勉強にもなります。
拡張機能 → URLからインストール の中にある一番上のテキストエリアにgitHubのリンクをコピーし貼り付けてインストールボタン。
https://github.com/DominikDoom/a1111-sd-webui-tagcomplete.git
日本語でプロンプトの単語を選べる:easy-prompt-selector
あまり使わないかもですが、日本語で直感的にどんなものが作りたいか単語を選ぶだけでプロンプトに自動挿入されます。
https://github.com/blue-pen5805/sdweb-easy-prompt-selector.git
モデルやRoLAのサムネが表示できる:Civitai Helper
どんなモデルだったのか、たくさん試しているとわすれがちですが
モデルやRoLAがサムネイル表示されているとどんなものだったかわかりやすいので非常に便利です。
https://github.com/butaixianran/Stable-Diffusion-Webui-Civitai-Helper
Scan を押して少し経つとスキャンが終わります。
txt2imgに移動して Checkpoints の中を見てみると…
ちゃんとサムネイルが表示されてました。これは便利。
便利な機能は他にも…
発見したら随時更新。今日はここまで。。
追記
StableDiffusionのアンインストール方法
色々やってたらバグってStableDiffusionがうごかなくなってしまったのでもアンインストール方法も覚書しておきます。
ターミナルで無邪気に下記をペースト
rm -rf stable-diffusion-webui/
これで音沙汰もなく消えました。
lsで見ても表示されてなければOKです。
物理的にフォルダ見に行ったらちゃんとなくなってました。