見出し画像

Stable Diffusion で高解像度画像を作るメモ〜Hires.fixとTiledDiffusion〜

自分の設定のメモです。
使うCheckpoint(モデル)によって最適値は変わりますので話半分でお読みください。皆さまの学びになる内容は少ないと思います。

今までやっていた方法

  1. t2i で 512サイズを生成

  2. Photoshopで指とか修正

  3. TiledDiffusion で2倍にアップスケール

  4. Photoshop で指の修正と最終的な調整

Hires.fix を使わない理由は、LoRA Block Weight が Hires.fix で適用されない時期があったからです。
Hires.fix の時に異なるプロンプトを適用できるアップデートありましたよね。あのへんです。
もしかしたら自分の環境だけかもしれませんが。

今までのやり方でアップスケール

今回メモする方法

  1. t2i で 512サイズを生成

  2. Hires.fix で2倍にアップスケール

  3. Photoshop で指とか修正

  4. TiledDiffusion で2倍にアップスケール

  5. Photoshop で指の修正と最終的な調整

最終的に2048サイズになります。

まずHires.fixして……
さらにTiledDiffusionでアップスケール
ちょっとノイズが多いのでまだまだ調整が必要

やり方を変えようと思った理由

【1】細部の書き込みをアップしたい
X(旧Twitter)に公開するだけなら1024で十分なんですが、支援サイトで高解像度を提供したいな〜。

【2】加筆修正の誤差を減らしたい
512サイズで指を修正してもアップスケールでちょくちょく破綻します。再度修正するのも面倒だから破綻率を減らしたいな〜。

【3】一部のモデルだと Hires.fix のほうがいい感じになる
アニメ塗りのモデルだと Hires.fix のほうが良い結果になることが多くて Hires.fix を再検討することになりました。

予想される問題点

修正の精度が求められる=自分の画力が求められる

これにつきます。
下の画像のように腕を変更したり、背景の余計なものを消すのはよくあります。しかし2回目のアップスケールは Denoising strength (元の絵から変更する度合い)が小さいから、自分の修正がヘタクソだったらヘタクソなままアップスケールされるんですね。

左:オリジナル
右:右手を後ろに隠した
こんな加筆修正は日常茶飯事です

Hires.fix の設定

  • Sampling method: DPM++ 2M Karras

  • Sampling steps: 30

  • Hires steps: 10

  • Denoising strength: 0.5

  • Upscaler: SwinIR_4x

i2i + TiledDiffusion の設定

  • CFG Scale: 7

  • Denoising strength: 0.3

上の「豪華なリビングのメイドさん」は荒々しさが目立つので Denoising strength は 0.2 でもいいかもしれません。
変更度合いが小さくなるから自分の加筆精度がさらに求められる……。

  • Method: Mixture of Diffusers

  • Upscaler: SwinIR_4x

  • Noise Inversion: ON

  • Inversion steps: 50

余談:アップスケーラーの話

アップスケーラーって何使ってます?
自分は SwinIR_4x がメインですが、気分で 4x_UltraSharp も使います。

CH@さんがアップスケーラーの比較してましたので是非チェックしてみてください。ALTに所感も書かれてて大変役立つ資料です。

試しに 4x-Fatal-Anime を使ってみたら、暗部の引き締まりとテクスチャ密度が凄く、鬱蒼とした密林を表現するのに最適だと思いました。

こちら比較です。


宣伝

クリエイター支援サイト・Fantasfic でファンクラブを開設しております。小さい女の子がえろえろえっちっちな内容なので囲炉裏に興味がある紳士は是非お越し下さい。
苦手な方はクリックしないほうが賢明です。


いいなと思ったら応援しよう!