Stable Diffusion Web UI（AUTOMATIC 1111 版）への回帰。

2024年8月19日 13:12

この記事の中で Kling AI による思いがけない挙動の動画を生成した
ことをきっかけにして、それまでと違ってこの静止原画の出来映えに
特別感を覚えるようになりました。それまでは1 回の描画バッチ処理で
12 画を描かせた多数の画の中の 1 画に過ぎなかったのでしたが。

これが Stable Diffusion Web UI（AUTOMATIC 1111 版）での原画です。この
記事の時点では「Refiner 機能でmeichidarkMix_meichidarkV45.safetensors
を0.2 から0.3（後者の影響量80 % から70 % ）を加味」などと、2 種類の
バッチ処理からの成果をひと纏め（＝手抜き）にして公開した画の中の
1 画に過ぎませんでした。

CivitAI への公開してあったことで、プロンプトなど描画に関するデータ
は全て保存されてありました。

もう少しこの画の派生（バリエーション）を数多く描画させたい気分に
なりましたので、現状使っている Stable Diffusion Web UI Forge で
seed 番号まで全て同じデータ環境にして描画させました。

ところが…。

近いですが、表情の詳細を含めて「何か期待と異なる」印象が否めません。
（脇腹部の無意味な露出もあえて IOPaint-LaMA で補正していません。）
2 回描画実施しましたが、seed 番号を含め環境が同じなので、寸分変わら
ない画が描画されました。つまり Stable Diffusion Web UI Forge では
そのプロンプトから上掲の静止画を得ることは絶対出来ないということ
なのでした。

Stable Diffusion Web UI（AUTOMATIC 1111 版）でも改めて同じ条件で
再描画しました。

ほぼ冒頭と同じ質感の画を得られました。やや細おもてでしょうか。

同一バッチ内の派生では Kling AI での描画でいろいろな挙動に振り回された
原画も再描画されていました。やや眼が小さめですが、Stable Diffusion
Web UI Forge ではその再描画はありませんでした。

勿論、同条件の再描画で Stable Diffusion Web UI Forge でも多くの魅力的な
描画はありました。

Stable Diffusion Web UI Forge だけを使っていたら、プロンプトの推敲
をいくら重ねても、冒頭の画には至らなかったのだ、という事実が
急に重いものに感じて来ました。

2024/08/18（日）時点で自己歴代 2 位のアクセスを頂いたこの記事でしたが
趣旨（宗旨）変更をしなければなりません。

以前から気にはなっていましたが、Stable Diffusion Web UI Forge は
前回の作業環境をプリロードしようとするからか、起動に時間がかかり
ます。また CheckPoint ファイルを1 つだけ指定しての描画は速いものの、
Refiner 機能を使ってCheckPoint ファイルを重ねた描画を実行すると、
Stable Diffusion Web UI（AUTOMATIC 1111 版）より実行時間を要する
ように感じています。

描画の質が同等に満足できると踏んでの Stable Diffusion Web UI Forge
への作業環境の完全移行をして久しい（5 か月半ほど）のでしたが、
Stable Diffusion Web UI（AUTOMATIC 1111 版）を使わねば得られない
画もあるのだ、という「もしかしたらそういうこともあるかも知れない」
と深く考えることを避けてきた現実に突然行き着いたのでした。

きっかけは SD3 導入評価時に Stable Swarm UI 0.6.4 Beta が、今まで
使ってきた CheckPoint ファイルの描画の質をあまり継承しないこと
に気づいて、後出のプラットフォームが必ずしも従来の上位互換を
保証しないのだ、という事実に直面してからのことでした。

その懸念が Stable Diffusion Web UI（AUTOMATIC 1111 版）と
Stable Diffusion Web UI Forge の間にも、もしかしたらあるのかも
という漠然とした懸念が現実のものとなったと言えました。

プロンプトの吟味と描画実行の試行錯誤を Stable Diffusion Web UI
（AUTOMATIC 1111 版）と Stable Diffusion Web UI Forge の両方で
やらねば「得られた筈だった期待以上の成果」を取りこぼすことに
なるのではないか、という疑心暗鬼を否めなくなった訳です。

しかしまあ1 日の作業時間は有限で、今や静止画からの動画生成の
成り行きを見守って、公開までに動画編集加工をしたりの作業時間
による切迫も無視できません。

そこで当面、このように切り分けて見切り発車することにしました。

この記事のように、Refiner 機能を使ってCheckPoint ファイルを重ねた
描画を実行する際には、SDXL 系の CheckPoint ファイルを扱うと問題が
出るケースもあり、それを回避するために SD1.5 での描画に留めるなら、
Stable Diffusion Web UI（AUTOMATIC 1111 版）を使えば良い、と
考えました。

SD1.5 での描画で Refiner 機能を使わないなら、処理時間がそれほど
かからないので、Stable Diffusion Web UI（AUTOMATIC 1111 版）と
Stable Diffusion Web UI Forge を、特に微細なニュアンスにこだわる
人物画には併用しても良いか、と考えます。風景画では差はきっと
感じられないでしょう。

（サイバー女子隊員画ばかり描いている、ではなく、これらの差異と
いうか、描画プラットフォームの上位互換保証性が実は無かったと
いう事実は、風景画やメカ画ではきっと分からないものだった、と
いうのが大事なところでした。）

そしてメカ画など SDXL 系の CheckPoint ファイルをRefiner 機能無しで
描画するのは、Stable Diffusion Web UI Forge を使えば良いだろう、と
考えます。容量が 6 GB ほどある SDXL 系の CheckPoint ファイルを
Refiner 機能で扱うのは、GPU 用メモリ 8 GB 搭載の GeForce RTX4060 機
では無理だと考えます。

Fooocus でも SDXL 系の CheckPoint ファイルでの描画は可能ですが、
生成画のメタデータにプロンプトなどの描画データが記録されない
点で、Stable Diffusion Web UI Forge がより有益だろうと考えます。

Stable Diffusion Web UI（AUTOMATIC 1111 版）も、その後のバージョン
アップで SDXL や SD3 を扱えるようになった、という記事を見かけた
ことがありますが、タイトルを拝見しただけで内容把握まで至って
いません。ただ上述と同様に、バージョンアップで描画の傾向が
変わってしまうことも考えられ、現保有（v 1.6.0）の Stable Diffusion
Web UI（AUTOMATIC 1111 版）の描画ニュアンスはこのまま維持
したいと考えます。

今回の Stable Diffusion Web UI（AUTOMATIC 1111 版）での同条件下の
描画です。まず彩度が Forge よりナチュラルに感じます。
それは装甲に派手な指し色が少ないだけではなく、階調もマイルドです。
ただ、こちらだけで必要充分ともまた言い切れないのでした。

自己歴代 2 位のアクセスの上掲記事にも補記を入れませんと….。

ご覧いただきありがとうございます。

この記事が参加している募集

#AIとやってみた

36,640件

この記事が気に入ったらサポートをしてみませんか？