Stable Diffusion 3 Medium をローカル (ComfyUI) で動かしてみた

2024年6月13日 03:13

このモデルの面白そうな機能にテキスト生成があるんですよ！

テキスト生成: Diffusion Transformer architecture により、ノイズやスペルミスのないテキスト生成において、これまでにない結果を達成します。

つい最近、Midjourney で日本語のテキスト生成ができるよーみたいな記事を読んで、ローカルでも簡単にできないかなー？と思っていたところでした。

使い方

Hugging Face にいってアカウント作って色々同意する
README.md を読むと ComfyUI がおすすめされていたので必要に応じてインストール (私は Stabilitty Mattix で入れてます)
comfy_example_workflows/sd3_medium_example_workflow_basic.json を ComfyUI に読み込ませる
必要なモデルとテキストエンコーダーをダウンロードして良い感じにコピーする
1. StabilityMatrix/Data/Packages/ComfyUI/models/checkpoints/ 以下に置くもの
  1. sd3_medium.safetensors
2. StabilityMatrix/Data/Packages/ComfyUI/models/clip 以下に置くもの
  1. clip_g.safetensors
  2. clip_l.safetensors
  3. t5xxl_fp8_e4m3fn.safetensors
これで準備完了なので ComfyUI の Queue Prompt で画像生成するだけ！！！