マガジンのカバー画像

Image Generation

157
運営しているクリエイター

#SDXL

HuggingfaceにあるSDXL(pony系多め?)モデルの10個紹介@Diffuser形式

HuggingfaceにあるSDXL(pony系多め?)モデルの10個紹介@Diffuser形式

今回はHuggingfaceにあるdiffusers形式で公開されているSDXL(pony系多め)のモデルを10個紹介します。
なぜ、civitaiに沢山モデルがあるのにわざわざ紹介するのかというと、2点ほど理由があります。

一つ目はcivitaiのリンクがhuggingfaceのページにあるのですが、調べて見るとすでにcivitaiで公開されていなかったからです。気になりますね。
あとで探すの

もっとみる
【v1.1アプデ】SDXLモデルを半分に圧縮!?モデルをFP8に量子化してストレージを解放せよ!

【v1.1アプデ】SDXLモデルを半分に圧縮!?モデルをFP8に量子化してストレージを解放せよ!

24/08/25 15時頃追記(※スクリプトアプデしました)

 こんな感じで、初期のローカル版のコード実行時に変換前のキャッシュが残るようになっています。C:\Users\ユーザーID\.cache\huggingface\hub\以降のフォルダにリポジトリidフォルダがあったら削除してください。
 コードの改修が終わりましたので、お手数ですがローカル版ご使用の方は改めてダウンロードお願いいたし

もっとみる
【画像生成AI】 自然な文章で思い通りの画像生成を実現する最先端モデル『Kolors』を試してみた

【画像生成AI】 自然な文章で思い通りの画像生成を実現する最先端モデル『Kolors』を試してみた

Stable Diffusionでの画像生成の欠点は、生成したい画像の情景をカンマ区切りのタグで入力するので、思った通りの画像を生成できないことでした。
この問題の解決に繋がる研究成果がKuaishou Technologyよりもたらされました。Kuaishouは、GML (General Language Model)を用いて、英語と中国語の理解力が強化されたモデル『Kolors』を発表しました

もっとみる
SDXL LoRAの階層の比較

SDXL LoRAの階層の比較

LoRAを適用すると意図せず画風が変化することがあります。
画風変化を減らすためにLoRA Block WeightやSupermergerで特定の層の強度を0にします。その時どの層を切ればよいかの簡単な比較です。

SDXLのUNetの階層について

※解説記事によって階層の説明が異なるため正確でない可能性があります。
SDXLはIN04,05,07,08,MID,OUT00-05に影響力の大き

もっとみる
Google Colab で デルタもんLoRA を試す

Google Colab で デルタもんLoRA を試す

「Google Colab」で「デルタもんLoRA」を試したので、まとめました。

1. デルタもんLoRA「デルタもんLoRA」が「アルファパラダイス」のキャラクター「デルタもん」のLoRAです。「アルファパラダイス」のイラスト・音声・3Dデータなどのコンテンツは、AI に関連した利用に限り、目的を問わず自由に使うことができるとのこと。

2. Colabでの実行Colabでの実行手順は、次のと

もっとみる
【StableDiffusion Web-UI】SDXL環境を構築してANIMAGINE & Pony Diffusionを 試したい!【環境構築】

【StableDiffusion Web-UI】SDXL環境を構築してANIMAGINE & Pony Diffusionを 試したい!【環境構築】

■記事の対象ユーザ

1.StableDiffusion WebUI環境を構築してイラストを生成している
2.最近リリースされたANIMAGINE XL 3.0を試してみたいけどSDXL環境がない
3.どうせなら今話題のPony Diffusion V6 XLも・・・という欲張りさん

■ようするに?

・SDXL化自体は簡単
・ANIMAGINEはお手軽高性能だが高品質=エッチと捉えている節があ

もっとみる
素材1枚でキャラクターLoRAを作成する:SDXL編

素材1枚でキャラクターLoRAを作成する:SDXL編

 以前「素材が1枚で作るキャラクターLORA」をいう記事を書いたんですが、最近のAIイラスト環境の変化にあわせて、SDXLでも素材1枚でキャラLORAが作れるのかを試してみました。

 今回試した方法は2つ。

1:正則画像を使い、LORAそのもののポーズバリエーションを増やす。
2:1ポーズLORAの強度調整でバリエーションを増やす。

 「1」は前回と同じ手法で、「2」はSDXLの表現力の高さ

もっとみる
【ComfyUI】絵をラインアートに変換してAnimagineXLで塗り直す【SDXL】

【ComfyUI】絵をラインアートに変換してAnimagineXLで塗り直す【SDXL】

SDXLベースのモデルであるAnimagine XLではLineArtなどのControl NetモデルもSDXL用のモノを使う必要があります。

SDXL用のLineArtモデルのダウンロードSDXL用のLineArtモデルが配布されています。

この中からt2i-adapter_diffusers_xl_lineart.safetensorsをダウンロードして使用します。

ComfyUIの起

もっとみる
【SDXL】animagine-xl3.0を触ってみた感想

【SDXL】animagine-xl3.0を触ってみた感想

SDXLについてSDXLが公開されてもう何ヶ月も経ちました。公開された当初に一回触ってみたものの、パラメータの設定など慣れない部分があることと、生成結果がいまいち気に入らなかったことでSD1.5ベースのモデルをメインに使い続けることにしました。

先日、SDXLがベースのanimagine-xl3.0という大変人気のある素晴らしいモデルが公開されたことがきっかけに、親切の方々からパラメータの設定な

もっとみる
【SDXL】VRAM8GBでもAnimagineXLが動く! 低スペGPUとSDXLでAI画像生成!【RTX3060Ti検証】

【SDXL】VRAM8GBでもAnimagineXLが動く! 低スペGPUとSDXLでAI画像生成!【RTX3060Ti検証】

この記事では画像生成AIのローカル環境実装のStable Diffusion上でSDXL系モデルを動かす際、(一般的に力不足とされる)VRAMが8GBのGPUであるRTX3060Tiから利用する方法を解説します。動作も実用レベル。Stability MatrixのInferenceというAutomatic1111に似たUIを使います。

どうもこんにちわ、生成AI勉強会というワークショップにて、画

もっとみる
ComfyUIで顔のin-paintingマスクを作る (3種)

ComfyUIで顔のin-paintingマスクを作る (3種)

こんにちは。季節感はどっか行ってしまいました。
今回も地味なテーマでお送りします。

顔のin-paintingMidjourney v5やDALL-E3(とBing)など、高品質な画像を生成できる画像生成モデルが増えてきました。
新しいモデル達はプロンプトを少々頑張るだけで素敵な構図の絵を生み出してくれます。StableDiffusion 1.5でよくある真ん中に美少女どーん、みたいな画像だけで

もっとみる
より強力になったディープフェイク機能「ReActor」を試してみる

より強力になったディープフェイク機能「ReActor」を試してみる

ちょっと前(23年10月)に「roop」を使ってディープフェイク画像を作っていたのですが、それより高性能に改良されたモノが出ているらしいとのことで試してみました!

↓これが前回試した時の記事。この時もあまりの性能の良さに驚きまくったのにもっと良くなっているとはどういうこと…??

改良版の名前は「ReActor」。
roopを使ったことがあれば環境は整ってるので、extensionから下記をイン

もっとみる
【ComfyUI+SDXL】描き込み強化を重視したHires.fixを組み込んだワークフロー

【ComfyUI+SDXL】描き込み強化を重視したHires.fixを組み込んだワークフロー

前回、AnimagineXL3.0でイラストを生成するための私のワークフローをご紹介しました。しばらくあのワークフローで生成していたのですが、いくつか気になる箇所が出てきたのでその解消を目的に、新しいワークフローを組み立ててみたので今回はそれを紹介します。

前回のワークフローで気になった箇所前回のワークフローで気になったのは、主に以下の2点でした。

Kohya's HiresFixを使うと構図

もっとみる
LCM LoRA の概要

LCM LoRA の概要

以下の記事が面白かったので、かるくまとめました。

1. はじめに「LCM」 (Latent Consistency Model) は、元モデルを別モデルに蒸留することで、画像生成に必要なステップ数を減らす手法です。25~50ステップかかっていた処理を4~8ステップで可能にします。

蒸留したモデルは、より小さくなるように設計される場合 (DistilBERT、Distil-Whisperなど)と

もっとみる