見出し画像

Stable Diffusion 3 Medium をローカル (ComfyUI) で動かしてみた

最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表

このモデルの面白そうな機能にテキスト生成があるんですよ!

  • テキスト生成: Diffusion Transformer architecture により、ノイズやスペルミスのないテキスト生成において、これまでにない結果を達成します。

つい最近、Midjourney で日本語のテキスト生成ができるよーみたいな記事を読んで、ローカルでも簡単にできないかなー?と思っていたところでした。

使い方

  1. Hugging Face にいってアカウント作って色々同意する

  2. README.md を読むと ComfyUI がおすすめされていたので必要に応じてインストール (私は Stabilitty Mattix で入れてます)

  3. comfy_example_workflows/sd3_medium_example_workflow_basic.json を ComfyUI に読み込ませる

  4. 必要なモデルとテキストエンコーダーをダウンロードして良い感じにコピーする

    1. StabilityMatrix/Data/Packages/ComfyUI/models/checkpoints/ 以下に置くもの

      1. sd3_medium.safetensors

    2. StabilityMatrix/Data/Packages/ComfyUI/models/clip 以下に置くもの

      1. clip_g.safetensors

      2. clip_l.safetensors

      3. t5xxl_fp8_e4m3fn.safetensors

  5. これで準備完了なので ComfyUI の Queue Prompt で画像生成するだけ!!!

生成された画像

デフォルトで以下の画像が生成されました。

テキスト生成してみた (https://ai-workstyle.com/ai-midjourney-japanese/ さんのプロンプトを拝借)

a female character with long, flowing hair that appears to be made of ethereal, swirling patterns resembling the Northern Lights or Aurora Borealis. The background is dominated by deep blues and purples, creating a mysterious and dramatic atmosphere. The character's face is serene, with pale skin and striking features. She wears a dark-colored outfit with subtle patterns. The overall style of the artwork is reminiscent of fantasy or supernatural genres A girl holds a piece of paper and inside it is written the word “hello world”

1枚目と同じプロンプトの最後に「A girl holds a piece of paper and inside it is written the word “hello world”」を付けただけ。すごー。

日本語はどうかというと・・・。

a female character with long, flowing hair that appears to be made of ethereal, swirling patterns resembling the Northern Lights or Aurora Borealis. The background is dominated by deep blues and purples, creating a mysterious and dramatic atmosphere. The character's face is serene, with pale skin and striking features. She wears a dark-colored outfit with subtle patterns. The overall style of the artwork is reminiscent of fantasy or supernatural genres A girl holds a piece of paper and inside it is written the word “こんにちは世界”

だめだーーーーーーー。「こんにちは世界」は無理だった。

文献参照しても日本語の話書いてなかったし、

頑張って日本語にできたらまた記事かこうかな。

いいなと思ったら応援しよう!

るーるーるー
サポートしてくれると記事もっと書きますー