8528 DiffusionをAUTOMATIC1111版Web UIで試してみた
日本初の画像生成AIイラスト集を発行された852話さんがオリジナル画像生成モデルの8528 Diffusionを公開されていたので、実際にAUTOMATIC1111版WebUIで使用してみました。
※(2022/12/29追記)本日公開された8528 Diffusion ファイナルバージョンをAUTOMATIC1111版WebUIで使用するためのコードを追加しました。
〇 852話さんによる日本初の画像生成AIイラスト集
1.8528 Diffusion Finalの実行
以下が8528 Diffusionファイナルバージョンの実行用に用意したコードです。これをColabノートにコピーし、GPUを選択してセルを実行し、Running on public URL:の後のリンクをクリックすると、操作画面が立ち上がります。起動時間は5分くらいです。
!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd /content/stable-diffusion-webui
!wget https://huggingface.co/852wa/8528-diffusion/resolve/main/8528d-final.ckpt -O /content/stable-diffusion-webui/models/Stable-diffusion/8528d-final.ckpt
!python launch.py --share --xformers --enable-insecure-extension-access
以下が実際に生成した画像です。発色が鮮やかで画質も安定しています。
2.4種類の画像生成モデルの比較
次に、他のモデルと比較するために4種類の画像生成モデルを切り替えてWeb UIで使えるコードを用意しました。上と同じようにセルを実行して、7分程度で起動します。
!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd /content/stable-diffusion-webui
!wget https://huggingface.co/852wa/8528-diffusion/resolve/main/8528d-final.ckpt -O /content/stable-diffusion-webui/models/Stable-diffusion/8528d-final.ckpt
!wget https://huggingface.co/hakurei/waifu-diffusion-v1-3/resolve/main/wd-v1-3-float32.ckpt -O /content/stable-diffusion-webui/models/Stable-diffusion/wd-v1-3-float32.ckpt
!wget https://huggingface.co/Linaqruf/anything-v3.0/resolve/main/Anything-V3.0-pruned.safetensors -O /content/stable-diffusion-webui/models/Stable-diffusion/Anything-V3.0-pruned.safetensors
!wget https://huggingface.co/prompthero/openjourney/resolve/main/mdjrny-v4.safetensors -O /content/stable-diffusion-webui/models/Stable-diffusion/mdjrny-v4.safetensors
!python launch.py --share --xformers --enable-insecure-extension-access
モデルは操作画面左上のcheckpointの欄で切り替えられます。
以下が同じプロンプト、同じシード値で4種類のモデルで生成した画像です。左上が8528 Diffusion final、右上がWaifu Diffusion v1.3、左下がAnything V3、右下がOpenjourneyです。
8528 Diffusion finalは、全体的にアニメイラストらしい画像で、色鮮やかで細部もよく書き込まれています。
Waifu Diffusion v1.3も、アニメイラストらしい画像ですが、細部の書き込みが足りず、平板な画像になるときがあります。
Anything V3は、少し淡い色調で、絵柄が崩れにくく、整っています。鮮やかな色調とどちらがよいかは好みの問題になります。
Openjourneyは、実写寄りのくっきりとした画像になります。
3.8528 Diffusion v0.3~v0.5モデル
8528 Diffusion v0.3~v0.5とファイナルバージョンの4種類のモデルを切り替えて使えるコードを用意しました。使い方は上と同じです。
一つのモデルだけを使いたい場合は、「!wget」で始まる4行の中から1行を選んで、残りは削除してください。
!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd /content/stable-diffusion-webui
!wget https://huggingface.co/852wa/8528-diffusion/resolve/main/8528d-final.ckpt -O /content/stable-diffusion-webui/models/Stable-diffusion/8528d-final.ckpt
!wget https://huggingface.co/852wa/8528-diffusion/resolve/main/8528d-v0-3.ckpt -O /content/stable-diffusion-webui/models/Stable-diffusion/8528d-v0-3.ckpt
!wget https://huggingface.co/852wa/8528-diffusion/resolve/main/8528d-v0-4-fp16.ckpt -O /content/stable-diffusion-webui/models/Stable-diffusion/8528d-v0-4-fp16.ckpt
!wget https://huggingface.co/852wa/8528-diffusion/resolve/main/8528d-v0-5-full.ckpt -O /content/stable-diffusion-webui/models/Stable-diffusion/8528d-v0-5-full.ckpt
!python launch.py --share --xformers --enable-insecure-extension-access
以下が同じプロンプト、同じシード値で4種類のモデルで生成した画像です。左上が8528 Diffusion Final、右上がv0.3、左下がv0.4、右下がv0.5です。
Finalは、結構他と違いがありますね。よりアニメイラストらしい絵柄になっていると思います。