見出し画像

突然 dev 型のFLUX.1 が動くようになった...。

CivitAI でサイバー女子隊員画が公開出来ない事態は、本記事以降の
内容にかなり色濃く影響します。折角の描画革新も公開の場を失う
からでした。
ただ現時点ではその落ち着きどころが見えないので、既に書き終えていた
一連の FLUX.1 描画に関する 5 記事(本記事含む)を公開継続します。


先の記事でどうにか好みの表現の範疇に描画が収まって来た、当方環境
での制限だらけの FLUX.1 描画でしたが、髪の毛の質感など画質には
かなりの難があって、それを我慢するしかないのであれば、表現の
主戦場にはなれないなあ、という気持ちも否めませんでした。

昔の安いプリンタで印刷した頃を思い出す、髪の毛の流れと異なる垂直・
水平方向の像の粗さが髪質描画の美しさを減じたり、目元の詳細が潰れたり
の難点が、SD1.5 描画にも質で追いつけていない印象です。

折角、描画手法のレパートリーに含められそうな LoRA ファイル
(IOPaint-LaMA でほぼ全画、nipples 隠しは必要ですが^^;)による
愛らしい表情が可能となった一方で、この難点はどうにかならない
ものか、と課題は残りました。
しかしノートPC の基板の中にあるGPU の増強など出来るものでも
ありません。(基板差し替えで増強可能なデスクトップ機を置くゆとり
は、創作環境をPC 上に移管したために全く稼働しなくなった鍵盤楽器
や録音機材がラックに山積みの自室 6 畳にはありませんでした。)

ノートPC にしても収納ベッドの足元でこれほどアクロバチックな設置しか
出来なかったのでした。(この木製自作棚は大地震に耐えないでしょう。)

ところが….。

最小サイズの flux1-schnell-bnb-nf4.safetensors (HDD 上の格納実測
11.21 GB)しか動かず、ほんの少しサイズが大きい flux1-schnell-
fp8.safetensors(同 11.61 GB)はもう動かなかった当方のメイン PC
(Geforce RTX4060 ノート機)でしたが、2024/09/06(金)の朝、
何故か flux1-dev-bnb-nf4-v2.safetensors(同 11.76 GB)の処理が
通るようになりました。VAE / Text Encoder も t5xxl_fp8_e4m3fn.
safetensors(同 4.78 GB)だけでなく t5xxl_fp16.safetensors
(同 9.56 GB)でも処理が通るようになりました。

どうやら PC を起動した直後で、他のアプリケーションが裏で立ち上がって
いないことが良いようです。なので Chrome を使ってCivitAI やネット記事
の作例からプロンプトをPC 上のメモ帳などを経由したりして、Stable Diffusion Web UI Forge の prompt 欄にペーストしたりするともうダメで、
そこから PC を再起動してStable Diffusion Web UI Forge も再起動した後、
直前のプロンプトをリコールするボタン(下図左端)で直前の内容
を呼び戻し、そこから実行すると処理が通るようになったようです。


(追記:同日)
この点も後日改善がありました。このアクロバチックな起動方法も
最新の update.bat で不要となりました。詳細は後日の記事で。


この時「seed」もリコールされてしまうので「-1」(ランダム)に
しておかないと毎回同じ画を描かせてしまいます。
(次図右端のボタンにて)

しかし…。

怖い…(^^;)。美しくもない…..。

画が拡散して収まりません。プロンプトが推奨の 75 トークンを超えている
弊害なのか、と後半の修飾句を中心に削除して短くしてみましたが
変化がありません。「Sampling steps」も推奨の「20」からいろいろ
変えてみましたが効果がありませんでした。

しかし先日以来、参考にさせていただいているこの記事のプロンプトを
使って描画させてみたら、しっかり描画が出来ました。
(重ねて情報のご提供に感謝です。)

プロンプト:A photorealistic portrait of a young woman with dyed pastel pink hair and subtle makeup, wearing trendy streetwear, standing in a bustling urban crossing with neon signs in the background

このことから推測出来たことは…。

flux1-schnell-bnb-nf4.safetensors までは通っていた、GPU 搭載なし PC
と NMKD Stable Diffusion GUI での入門以来、ずっと継ぎ足しを繰り返して
来た自身のプロンプト記法が、flux1-dev-bnb-nf4-v2.safetensors では
受け付けられなくなった、ということかと考え、プロンプトを一旦
平文化しました。

(flux1-schnell-bnb-nf4.safetensors までは通っていたもの)

outdoor, ((upper body)), ((( wearing gray and black nano-suits)))+++, short bob hair, (wide hip:0.5, large breasts:0.5, perfect slender young girl body),Perfectly glossy skin ,25 yo mature girl, , picture of a vivid, (masterpiece:1.2),(extremely detailed),(8k:1.1),(perfect lighting,best quality,highres,original),(realistic photography:1.4) ,high detailed skin,shaded face, soft lighting, (small face),RAW, ultra highres, pores visible, , shiny_and_glossy_skin, asian beauty, (gorgeous beautiful 20 years old asian girl), ((best detailed slender body)), (asian idol, asian beauty, asian mixed), (complex, Machine background ,spaceship outdoors background, Mecha Transport parts:1.2), (dark and foggy environment:1.1), ((heavy fog environment:1.1)), (battlefield behind:1.2), 

改めて良く見ると、中には重複かつ相互矛盾する内容もありました。
これを整理しつつ平文にして、効果割合を記述したり強調指示したり
する箇所をとりあえず無視してみました。
強調表記などは Stable Diffusion Web UI(AUTOMATIC 1111 版)以降は
あまり作例で見ないなと、実は長い間気にはしていたものでした。
NMKD Stable Diffusion GUI 固有の表記だったのかも知れません。
(効果はありましたが、表記方法が古いのかもしれません。古いと
言ってもたった 1 年前のことでしたが。)

(整理・平文化したもの)

outdoor, medium shot,wearing gray and black nano-suits, wide hip, large breasts, perfect slender young girl body, perfectly glossy skin ,25 yo mature girl,picture of a vivid, masterpiece,perfect lighting, asian beauty, Machine background ,spaceship outdoors background, Mecha Transport parts, dark and foggy environment, heavy fog environment, battlefield behind,

画の拡散が収まりました。先の記事で多用した LoRA ファイル、
flux-000003.safetensors は使っていませんでしたが、IOPaint-LaMA
での nipples 消し込みは必要でした。

【重要追記(同日):この平文化の処置は、根本対策ではありません
でした。旧表記を flux1-dev-bnb-nf4-v2.safetensors からは受付られ
なかったのではなく、原因が全く別にあったことが後日の再発時に
判明します。詳細は後日の記事にて。】

flux1-schnell-bnb-nf4.safetensors より格段に画質は美しいですが、
LoRA ファイルによる修飾が無い CheckPoint 剥き出し描画では顔が
怖いです。当方が最も忌み嫌う「西洋人が上から見下す東洋人の
イメージ」そのものです。

早速、お気に入りになりつつある flux-000003.safetensors を「1.4」
ブレンド設定で使ってみます。

outdoor, medium shot,wearing gray and black nano-suits, wide hip, large breasts, perfect slender young girl body, perfectly glossy skin ,25 yo mature girl,picture of a vivid, masterpiece, ,perfect lighting, asian beauty, Machine background ,spaceship outdoors background, Mecha Transport parts, dark and foggy environment, heavy fog environment, battlefield behind,
<LoRA : flux : 1.4>

しかし…。

LoRA の修飾途中(Patching LoRAs for KModel)で処理が異常終了
しました。何度か試行しましたが同じ結果に終わりました。
この処理は CPU VRAM へのスワップ処理が行われないようで、
やはり GPU VRAM 8GB 環境にはやはり荷が重いのでしょう。

少しでも作業領域を減らすために再び、VAE / Text Encoder を
t5xxl_fp16.safetensors(HDD 上の格納実測 9.56 GB)から
t5xxl_fp8_e4m3fn.safetensors(同 4.78 GB)に戻しました。

まるで綱渡りのような試行錯誤でしたが無事処理が通りました。
LoRA ファイルを使う時には当方環境では
t5xxl_fp8_e4m3fn.safetensors がマストアイテムのようです。

flux1-dev-bnb-nf4-v2.safetensors + t5xxl_fp8_e4m3fn.safetensors
+  flux-000003.safetensors による描画です。

プロンプトに「smiles,」を追加しました。

当方が SD1.5 で追求して来た美しさに追いつけた感があります。
(技術革新の流れ上、本来それは是なのかとも思いますが実感です。)

全画とも IOPaint-LaMA で nipples を修正済です。
LoRA なしでの怖い顔は解消となりましたが、nano-suits の質感は
flux1-schnell-bnb-nf4.safetensors のほうが格段に良かったです。
flux1-dev-bnb-nf4-v2.safetensors 描画では装甲っぽくなく不要に、
というか過剰に艶めかしいです。
nipples だけでなく、装甲と似つかわない生々しい navel(へそ)を埋める
ことも多くの画で必要で、まるでボディペインティングの画に見えそう
です。

まあ未来のことですから(^^;)、こう見えて強靭な硬度と驚異の柔軟性を両立させて、サイバー女子隊員の身体を保護しているという設定も出来なくはないですが(そもそも頭と顔は無保護でどうなんだ、という…)、画質以外は flux1-schnell-bnb-nf4.safetensors が良かったかなあ、と思います。

flux1-schnell-bnb-nf4.safetensors +  flux-000003.safetensors による画

あちら立てればこちら立たず….まあ直前までは描画の選択肢が
flux1-schnell-bnb-nf4.safetensors しか無く、LoRA ファイルでの修飾で
描画にバリエーションを持たせるしか活路は無いと諦めていた次元からは
贅沢な悩みですか(^^)。
先の記事での fluxAsianRealistic_v10Fp8.safetensors のように、もう他の
Flux.1 用の CheckPoint ファイルがやはり使えなくても、選択肢が 1 か 2
では倍も違うのですから。

それに「Sampling steps = 20」での描画が可能となったのですから、
これまで有効に感じなかった LoRA ファイルも作例通りに使えるよう
になるのではないかと期待します。

なんだ「撤退」どころか、またひとつ追求しなければ後ろ髪を引かれて
自身が充足出来ない作業が増えてしまいました….(^^;)。




ご覧いただきありがとうございます。




この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?