見出し画像

【SD3.5】Stable Diffusion 3.5 mediumを使ってみた話【medium】

はじめに

SD3.5のmediumモデルがダウンロード可能になったので、ローカルで使ってみました。※ RTX3060(12GB)

Largeモデルは下記事です。

ComfyUIワークフロー

今回もこちらの説明通りに導入しました。

ComfyUIワークフロー(モデルをlargeからmediumに変更しただけ)

しかし、トラブりました。

Error(s) in loading state_dict for OpenAISignatureMMDITWrapper:

ComfyUIエラーメッセージ

原因はComfyUIのアップデートが失敗していた事ですが、ComfyUI Manager経由でのアップデートが(何故か)上手く機能していませんでした。

その事に気づかず、全く別のエラー切り分けをしていたので時間を無駄にしてしまいました。最終的に手作業の「git pull」コマンドで解決です。

生成テスト

筆者環境で生成時間は30秒程度でした(30step RTX3060)

(SD3.5 medium 1024x1024)A photorealistic image of a sleek and agile black cat leaping over a row of colorful trash cans on a vibrant city street. The cat's paws are extended, its muscles tensed, as it propels itself through the air with incredible agility. The city street is bustling with activity, people and cars moving in every direction, but the cat's dynamic motion captures our attention. The lighting is warm and golden, with the late afternoon sun casting a long shadow behind the cat. The style of the image is photorealistic, with intricate details and textures that bring the scene to life.

ちなみに同じプロンプトでのFlux.1-devの結果です。

(Flux.1dev 768x1024)

まとめ

Flux.1-devと比べるとSD3.5の方がライセンスが緩いので、これからのコミュニティの発展に期待しています。


いいなと思ったら応援しよう!