画像生成AI忘備録　11月号

かたらぎ

2023年11月30日 04:58

stable Diffusion webUIの導入

NovelAI V3　初心者向け講座

ホットトピック

Animate Anyone

　Animatediffなどと同じようにstableDiffusionを基盤に動画生成ができるものです。以前のものより一貫性が高く、一枚の絵から動かせるのが特徴です。まだ、デモやモデルの配布などは行われていませんが期待の持てる技術です。

　抹茶もなかさんがこの技術について非常に詳しく解説してくださっている記事があるので内容に興味のある方はこちらをご覧ください。

SDXL Turbo

ComfyUI導入してSDXL torbo×A6000で生成してみた！
結果100枚出力が16秒、素で6fpsくらい出せました(笑)
高速でスクロールしていくコンソールが圧巻でした😎 pic.twitter.com/og7atH4c5I
— かたらぎ (@redraw_0) December 1, 2023

　SDXL Turboとは1stepで画像を生成できるモデルのことです。環境構築のいらないデモは下記のリンクからご利用いただけます。

　同じく環境構築不要でgoogle Colubなどで使うこともできます。

　stable Diffusion WebUIなどのローカル環境ではこちらのhuggingfaceのページからダウンロードしてください。WebUIではV1.6.0での動作は確認しています。

　またSDXL系モデルならSDXL turboを差分LoRAとして抽出できます。抽出したLoRAの容量を削減したモデルは私のhuggingfaceにあります。

LCM-LoRA

　LCM-LoRAは画像生成を高速化する手法の一つです。専用または一部の既存のサンプラーで動作し、非常に少ないステップ数(4～8程度)、低いスケール(1~2程度)で動作します。通常のLoRAを使うときと同じように使えるため非常にお手軽です。
　まゆひらさんの記事で詳しい導入方法が分かります。

　ぶるぺんさんのnoteでも同じ様に導入方法が確認できますがおまけとして独自の拡張機能が公開されています。

　LoRAの配布先にはSD1.5系とSDXL系で使える2つのバージョンがあります。

　また、アニメであるLinaqruf氏制作のanimagine-xl-2.0用 LCM-LoRAもあります。アニメモデルでの動作を試したい方はこちらを使ってください。

https://t.co/IvPCfhKgVT

animagine_xl2.0用に学習したLCM-LoRAあげてみた
多分性能上がってんじゃね
— furusu (@gcem156) November 27, 2023

　LCM-LoRAを使う際はサンプラーによってうまく生成されないものがあるので気を付けてください。

LCM-LoRAのサンプラー性能比較テスト
左がLCM使用、右が未使用の同一seed
CFG2でstepは4,6,8での調査、明らかに崩壊したサンプラーは除外

DPM++ SDE Karras
未使用：収束早めだがボヤける
LCM：適正◎

Euler a
未使用：収束不足
LCM：適正○(step少し多めに必要)

DPM++ 2S s… pic.twitter.com/LmiY4OYN3h
— ステスロス@創作/画像生成AI/雑学RT (@StelsRay) November 20, 2023

TensorRTの導入

　TensorRTとはWebUIで画像生成を高速化する手法の一つです。導入に関しては人によってすんなりいく場合と、いかない場合があります。自分がTensorRTを利用可能かどうかは一度WebUIの別環境を作ってそちらで試してもいいかもしれないです。その際はCドライブ(OSが入っているドライブ)で試すのがおすすめです。自環境では他ドライブで試したときうまくいかないことがありました。

まず、NVIDIA公式からTensorRTの拡張機能をダウンロードします。

コピー用URL
https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT

　拡張機能の入れ方は他と変わりません。WebUIの拡張機能タブから「URLをインストール」を選択し、「拡張機能のリポジトリのURL」に上のURLをコピーして入れてください。あとはインストールを押すだけです。
　ここでWebUIを再起動(コマンドプロンプトを閉じて立ち上げなおす)してください。通常、ここでタブが表示されるはずなのですが表示されない人も多くいるようです。　このお三方のnoteにトラブルの対処方法が多く載っています。(一番詳しいのはまゆひらa氏)

stable Video Diffusion(動画生成)

　動画用のstableDiffusionモデルを利用して動画を生成できます。google Colabで動かす場合は下記の記事を参考にしてください。

　ローカルでのインストールや動画生成の方法については二つの記事が役に立ちます。

kritaを使っての生成お絵描き

　Kritaとは無料で使えるオープンソースのペイントソフトでLCMによる高速生成を活用したリアルタイムでのお絵描きができます。

デモはこちら

KritaでリアルタイムAIお絵かきできた！
しかも、自作のトレーニングモデルでできるとか最高かよおぉー！
t2iだと安定性ないけど自分で描けるなら十分戦える！ pic.twitter.com/OnQpcCTTQF
— かたらぎ (@redraw_0) November 19, 2023

　またkritaでは画像生成に好きなモデル・LoRAを使えます。LoRAの使用方法は「ComfyUI\models\lora」に使いたいLoRAを配置してから下記ポストの④の部分に隠れている「add」ボタンで追加するだけです。

kritaのAIお絵描きで好きなモデルを使う方法

まず「Users\[ユーザー名]\AppData\Roaming\krita\pykrita\ai_diffusion\.server\ComfyUI\models\checkpoints」に使いたいモデルを配置。

kritaで歯車マークの設定から画像のようにコンフィグ作成して選ぶだけ！ pic.twitter.com/YkG6xSV2sQ
— かたらぎ (@redraw_0) November 19, 2023

　導入方法や使い方の詳しい点は青猫さんの解説記事がおすすめです。

LCM_i2i_PoC

　抹茶もなかさんの画面取り込み式では画面をキャプチャして使用するためフォトショップやクリップスタジオペイントなどの任意のペイントソフトでも使うことができます。

画面取り込み式のLCMリアルタイム変換ツール更新しました！https://t.co/xSOVSLw4Es
こんな感じで画面取り込んでLCM適用できます！
Gradioかまして無いぶん他より速そう？ pic.twitter.com/n3exJHUwnW
— 抹茶もなか (@GianMattya) November 20, 2023

　とりにくさんによる改造版もあるようです。

抹茶（@GianMattya）さんのLCM_i2i_PoCを改造したので公開してみました。
RTX3060↑のビデオカードをお持ちで、リアルタイム生成
AIお絵描きに興味ある方はどうぞ！
画面固定機能、LoRA・vae指定機能、キャプチャ機能追加。またインストールスクリプトも追加しましたhttps://t.co/sMtrEKZ6Vj https://t.co/YsJgFKuACx
— とりにく (@tori29umai) November 28, 2023

Checkpoint（モデル）の一覧

まゆひら氏による各SDバージョンごとのまとめ

SD1系モデル

SD2系モデル（SD2系のみ別の方のリンクも掲載）

SDXL系モデル

VAE

LoRA

自著。ローカルでのloraの作り方について解説した初心者向けの教本。

画像生成AI忘備録 11月号