Stable Diffusion で高解像度画像を作るメモ〜Hires.fixとTiledDiffusion〜
自分の設定のメモです。
使うCheckpoint(モデル)によって最適値は変わりますので話半分でお読みください。皆さまの学びになる内容は少ないと思います。
今までやっていた方法
t2i で 512サイズを生成
Photoshopで指とか修正
TiledDiffusion で2倍にアップスケール
Photoshop で指の修正と最終的な調整
Hires.fix を使わない理由は、LoRA Block Weight が Hires.fix で適用されない時期があったからです。
Hires.fix の時に異なるプロンプトを適用できるアップデートありましたよね。あのへんです。
もしかしたら自分の環境だけかもしれませんが。
今回メモする方法
t2i で 512サイズを生成
Hires.fix で2倍にアップスケール
Photoshop で指とか修正
TiledDiffusion で2倍にアップスケール
Photoshop で指の修正と最終的な調整
最終的に2048サイズになります。
やり方を変えようと思った理由
【1】細部の書き込みをアップしたい
X(旧Twitter)に公開するだけなら1024で十分なんですが、支援サイトで高解像度を提供したいな〜。
【2】加筆修正の誤差を減らしたい
512サイズで指を修正してもアップスケールでちょくちょく破綻します。再度修正するのも面倒だから破綻率を減らしたいな〜。
【3】一部のモデルだと Hires.fix のほうがいい感じになる
アニメ塗りのモデルだと Hires.fix のほうが良い結果になることが多くて Hires.fix を再検討することになりました。
予想される問題点
修正の精度が求められる=自分の画力が求められる
これにつきます。
下の画像のように腕を変更したり、背景の余計なものを消すのはよくあります。しかし2回目のアップスケールは Denoising strength (元の絵から変更する度合い)が小さいから、自分の修正がヘタクソだったらヘタクソなままアップスケールされるんですね。
Hires.fix の設定
Sampling method: DPM++ 2M Karras
Sampling steps: 30
Hires steps: 10
Denoising strength: 0.5
Upscaler: SwinIR_4x
i2i + TiledDiffusion の設定
CFG Scale: 7
Denoising strength: 0.3
上の「豪華なリビングのメイドさん」は荒々しさが目立つので Denoising strength は 0.2 でもいいかもしれません。
変更度合いが小さくなるから自分の加筆精度がさらに求められる……。
Method: Mixture of Diffusers
Upscaler: SwinIR_4x
Noise Inversion: ON
Inversion steps: 50
余談:アップスケーラーの話
アップスケーラーって何使ってます?
自分は SwinIR_4x がメインですが、気分で 4x_UltraSharp も使います。
CH@さんがアップスケーラーの比較してましたので是非チェックしてみてください。ALTに所感も書かれてて大変役立つ資料です。
試しに 4x-Fatal-Anime を使ってみたら、暗部の引き締まりとテクスチャ密度が凄く、鬱蒼とした密林を表現するのに最適だと思いました。
こちら比較です。
宣伝
クリエイター支援サイト・Fantasfic でファンクラブを開設しております。小さい女の子がえろえろえっちっちな内容なので囲炉裏に興味がある紳士は是非お越し下さい。
苦手な方はクリックしないほうが賢明です。