見出し画像

Stable Cascade Easyで簡単にStable Cascadeを試す

Last update 2-25-2024
※(2-25) 本記事が始まる前に、別の方法を紹介しているのでご覧ください。
※(2-20) v1.3で実装されたMagic Promptについて追記しました。
※(2-18) ダウンロード方法をリリース版に変更し、バージョンアップ後の画面に差し替えました。
※VRAMは12GBが必要です。本記事では実際の手順を示していますが、通常の記事よりも説明を省略しています。




 ComfyUIで生成する記事を公開しました。LargeモデルはVRAM 8GB、Liteモデルは6GBで実行できそうです。



▼ 本記事について

概要

 Stable Cascadeについては下記の記事を公開済みです。本家のリポジトリを導入しつつ、改良版のコードによりVRAM使用量を節約して実行できる内容です(6GB以上)。

 その本家リポジトリにGUI版も追加されましたが、どうやら24GBのVRAMを要求するようです(残念)。

 しかしこれとは別の、「44 seconds for a 1280x1536 image with a nVidia RTX3060 with 12 GB VRAM」をうたうStable Cascade Easyを紹介いただいたので(ありがとうございます)、さっそく使ってみます。

リポジトリ

stable_cascade_easy
https://github.com/another-ai/stable_cascade_easy 



▼ 準備

はじめに

 動作の確認は、VRAM 12GBのGeforce RTX 3060、Python 3.10、CUDA Toolkit 11.8が導入されたPCで行いました。作業ディレクトリを「C:\aiwork」としていますので、適宜読み替えてください。

ダウンロード

 リポジトリからgit cloneでインストールする方法が、GitHubのアカウントが必要になる上になぜか途中で詰まってしまいました。そのため、リリース版をダウンロードする方法で進めます。

 さきほど記載したリポジトリのURLへアクセスします。次に画面右側の「Releases」にある「+* release」へ進み、「stable_cascade_easy_v***.zip」のリンクからダウンロードします。ディレクトリ「C:\aiwork\stable_cascade_easy」を作成して、中に解凍したファイルをコピーします。

リリース版をダウンロードする

インストール

 次にコマンド プロンプトを開いて、下記のコマンドを順番に実行します。パッケージのインストールでしばらく時間がかかります。

cd \aiwork\stable_cascade_easy
install

 参考まで、v1.3のinstall.batの内容を記載します。リリース版のDiffusersでは実行時に問題が発生したので、暫定的に差し替えを行っているようです。

py -m venv venv
call .\venv\Scripts\activate
pip install -r requirements.txt
pip install git+https://github.com/kashif/diffusers.git@a3dc21385b7386beb3dab3a9845962ede6765887 --force
pause



▼ 実行

起動から生成まで

 コマンド プロンプトにて下記のコマンドを順に実行します。

cd \aiwork\stable_cascade_easy
app

 起動するとWebブラウザが開いてUIが表示されますので、さっそく使ってみます。

生成を試してみた(画面はv1.2)

 使い方までは特に説明しませんが、解像度は128の倍数を指定しないとエラーが出る場合があるようです。Seedを直接指定する場合は0から2,147,483,467の範囲にします。Schedulerを変更する場合は、最適な設定値についてリポジトリの説明を参照してください。

 生成した画像は「stable_cascade_easy\image」下に保存されます。

生成した画像を確認する

 画像には生成時のパラメーターが含まれています。

画像をテキストエディタ(EmEditor)で開いたところ

VRAM使用量

 1024x1024と768x768で生成してみたところ、最大9GB程度(起動前の使用量を除く)でした。生成時間のみが異なります。

2回生成してVRAM使用量を確認する

生成時間

 参考まで、生成に要した時間を掲載します。パラメーターは初期設定のままとします。モデルが適さない解像度では形状が狂ったりする場合がありますが、その点は考慮しません。

512 x 512 … 19.2 sec
1024 x 768 … 25.5 sec
1024 x 1024 … 28.6 sec
1536 x 1024 … 35.9 sec
1536 x 1536 … 47.6 sec
2048 x 2048 … 69.7 sec

 なお、2048x2048まで解像度を上げたところで、decode(STAGE A)時にVRAM(占有GPUメモリ)を使い切りました。それでも共有GPUメモリは使用していません。

2048x2048の場合のVRAM使用量

起動用のバッチファイル

 起動しやすくするため、「C:\aiwork\sce.bat」を作っておきます。筆者は、コマンド プロンプトを開いたときのカレントディレクトリに、「C:\aiwork」へ移動するバッチファイル「ai.bat」を設置しています。

@echo off
cd stable_cascade_easy
call venv\Scripts\activate.bat
python app.py
cd ..\
deactivate

バージョンアップの方法

 新しいバージョンを上書きして、下記のコマンドを順に実行してください。バッチファイル化したい場合は、「venv\Scripts\activate」を「call venv\Scripts\activate.bat」に変更してください。リリース版に入っている「update.bat」はgitコマンドが使用されています。

cd \aiwork\stable_cascade_easy
venv\Scripts\activate
pip install -r requirements.txt
cd ..\
deactivate



▼ 補足

Magic Prompt

 v1.3で追加された「Magic Prompt」について簡単に紹介します。この機能を有効にすると、入力されたPromptをいい感じ(?)に変更してから生成を行います。また、実行のたびにPromptが変化します。

 推奨値は32か64のようです。0の場合は機能が無効化されます。機能を有効にした初回の生成時に、モデル等のダウンロードが行われます。処理が追加されるため、生成にかかる時間は増加します。

 下記の画面では「watercolor anime style, upper body, 1girl, big eye, smile, brown ponytail hair, orange gingham sleeve dress, forest lakeside, sunrise,」を入力して、「watercolor_anime_style, upper_body, 1girl, big_eye, smile, orange_gingham_sleeve_dress, forest_lakeside, sunrise, leaf, looking_at_another, nature, night, night_sky, outdoors, pink_eyes, plant, red_scarf, scarf, sky, standing, star_(sky), starry_sky, tree」が生成に使用されました。この画像もおまけに載せておきます。

Magic Promptを有効にして指示とは少し異なるプロンプトで生成した



▼ おまけ

 生成画面に表示されている画像です。表紙画像は同じものが再度出てこなかったので、古い方も載せています。

anime style, watercolor, close up, 1girl, big eye, pigtail, sky blue floral skirt, white ribbon blouse, gray pigtails, farm rural village, spring flower, sitting, hold cat, meadow, distant mountain,
Negative prompt: teeth
Steps: 20, Sampler: DDPMWuerstchenScheduler, CFG scale: 4, Seed: 2104708980, Size: 768x1024, Model: stable_cascade
watercolor anime style, upper body, 1girl, big eye, smile, brown ponytail hair, orange gingham sleeve dress, forest lakeside, sunrise,
Negative prompt: teeth, ruck sack, shoulder, S
teps: 20, Sampler: DDPMWuerstchenScheduler, CFG scale: 4, Seed: 5411296132, Size: 768x1024, Model: stable_cascade
watercolor anime style, upper body, 1girl, big eye, smile, brown ponytail hair, orange gingham sleeve dress, forest lakeside, sunrise,
Negative prompt: teeth, ruck sack, bag,
Steps: 20, Sampler: DDPMWuerstchenScheduler, CFG scale: 4, Seed: 4797127310, Size: 1024x1024, Model: stable_cascade
watercolor_anime_style,upper_body,1girl,big_eye,smile,orange_gingham_sleeve_dress,forest_lakeside,sunrise,leaf,looking_at_another,nature,night,night_sky,outdoors,pink_eyes,plant,red_scarf,scarf,sky,standing,star_(sky),starry_sky,tree
Negative prompt: teeth, ruck sack, bag,
Steps: 20, Sampler: DDPMWuerstchenScheduler, CFG scale: 4, Seed: 2104708980, Size: 768x1024, Model: stable_cascade



▼ その他

 私が書いた他の記事は、メニューよりたどってください。

 noteのアカウントはメインの@Mayu_Hiraizumiに紐付けていますが、記事に関することはサブアカウントの@riddi0908までお願いします。

いいなと思ったら応援しよう!