見出し画像

DrwaThings(モデルダイアログ1)

画像生成の肝であるモデルを設定するダイアログにあるインポートに関する部分

ダウンロードファイル

Safari からファイルをダウンロードして、ファイル アプリの Draw Things フォルダーの下の「ダウンロード」に移動するか、URL を直接入力してインターネットからモデルをダウンロードすることができます。

モデル名

名前がモデルリストに表示されます。

トリガーワード

Dreambooth モデルは、多くの場合、珍しい単語/トークンでトリガーする必要があります。 ここにトリガー ワードを入力すると、モデルの選択時にプロンプトの前にこのトリガーが自動的に付加されます。

微調整された画像サイズ

モデルが微調整に使用した画像のサイズ。 ほとんどの v1 モデルは 512x512 に調整され、多くの v2 モデルは 768x768 に調整されます。

カスタムテキストエンコーダ

Dreambooth モデル (プレフィックス文字列を必要とするモデルなど) は、テキスト エンコーダも微調整します。 使用しているモデルがテキスト エンコーダーを微調整していないと思われる場合は、このモデルの選択を解除します (例としては、Anything v3、Waifu Diffusion、Hassanblend など)。

カスタム変分オートエンコーダー

一部のカスタム モデル (Anything v3 など) は、さらに良い結果を得るために変分オートエンコーダー (VAE) を微調整します。 他のモデル (ほとんどの Dreambooth モデルと同様) は、デフォルトのオートエンコーダーを使用するだけです。 これらのカスタム モデルは、多くの場合、VAE チェックポイントを個別に公開します。 したがって、VAE 用に別のファイルを選択できます。

V予測

Stable Diffusion v2 では、v 予測を行う蒸留モデルが導入されました。 これは、画像生成を高速化できる手法です (多くの場合、20 ステップで十分です)。 カスタム モデルが v 予測を使用する場合、正しくレンダリングするためにこれを有効にする必要があります。

より高い精度での注意

一部のカスタム トレーニング済みモデル (Stable Diffusion v2.1 768-v や Versatile Diffusion など) は、アテンション レイヤーでより高い精度で実行する必要があり、そうしないとレンダリングに失敗する可能性があります。 この要件を持たないモデルでこれを有効にすると、速度が 30% ~ 40% 低下します。

モデルバージョン  v1 または v2 または SDXL

Stable Diffusion v1 と v2 には互換性がありません。 インポートしたカスタム モデルが v1 に基づいているか、v2 に基づいているかは、自動的に推測されます。

街歩きがさらに楽しくなるものがあるといいな