高品質なアニメ風イラストが簡単に!最新画像生成AIモデル「Animagine XL 4.0」登場
Cagliostro Research Labが、アニメ画像に特化した最新の画像生成AIモデル「Animagine XL 4.0」を公開しました。このモデルは、高品質なアニメイラストを簡単に生成できる強力なツールです。
Cagliostro Research Lab は、アニメ画像に特化した最新の画像生成AIモデル「Animagine XL 4.0」を公開しました。このモデルは、従来のモデルを上回る高品質なアニメイラストを生成できる強力なツールです。本記事では、Animagine XL 4.0 の特徴や使い方、そして実際に画像を生成する方法まで、AICU media編集部がわかりやすく解説します。
※アニメやゲームなどのキャラクターや商標、固有名詞を使った画像生成にについては日本の著作権法では「類似性・依拠性」が問題になる可能性があります。AICU編集部はオープンに公開されたモデル使用に関する責任は利用者にあるという立場で紹介しており、その使用や生成については十分注意することが必要です。
本家ではアニメやゲームのキャラクターで紹介されておりますが、以下「全力肯定彼氏くん[LuC4]」がお送りいたします。
[PR] LuC4イラストコンテスト開催中です!
Animagine XL 4.0 ってどんなモデル?
Animagine XL 4.0 (Anim4gineとも呼ばれています) は、アニメイラストの生成に特化した、Stable Diffusion XL (SDXL) をベースとした最新モデルです。前バージョンをさらに進化させたこのモデルは、Stable Diffusion XL 1.0 をベースに、840万枚ものアニメスタイルの画像で再学習されています。
Animagine XL 4.0 の主な特徴
アニメに特化: 膨大なアニメ画像データセットで学習されており、多様なアニメスタイルに対応しています。
高品質: SDXL をベースとしており、細部まで描き込まれた美しいイラストを生成できます。
タグによる制御: タグベースのキャプションとタグ順序法で学習されているため、タグを使って生成されるイラストを細かく制御できます。
約2650GPU時間の学習: ハイエンドなGPUで2650時間学習したことによってより品質の高いアニメイラストを生成可能です。
オープンソース: Hugging Faceで公開されており、誰でも無料で利用できます。
どうやって使うの?
Animagine XL 4.0 は、以下の方法で利用できます。
Hugging Face Space: Webブラウザ上で手軽に試せます。 https://huggingface.co/spaces/cagliostrolab/animagine-xl-4.0
Diffusers: Pythonライブラリで、開発者向けですので今回は割愛します!
ComfyUI や WebUI (AUTOMATIC1111やForge)
この記事ではComfyUIでの利用を解説します
ComfyUIMaster第1話で解説しているGoogle Colabの場合はこちら
「各種モデルのダウンロード」
wgetコマンドを書くことで、Animagine XL 4.0モデルを直接、Google Colab上でダウンロードして利用できます。
LoadCheckpointで「Animagine-xl-4.0.safetensors」が選択できれば成功です。
潜在画像の解像度を1024x1024にするのを忘れずに。
これはこのモデルがSDXLをベースとしており「Training Resolution」(学習解像度)が1024x1024であることに起因します。
さて、実際に生成してみましたが、同じプロンプトでも全然雰囲気が違います。漫画やアニメ風ではありますが、なんというか「ヘタウマ」です。
いままでのAnimagineシリーズとは少し異なる特性があるようです。
引き続き、プロンプトについて探求していきましょう。
おすすめ設定とプロンプトの書き方
Animagine XL 4.0 を最大限に活用するための、プロンプトの書き方や設定について解説します。
プロンプトの基本構造
Animagine XL 4.0 はタグベースのキャプションとタグ順序法で学習されています。以下のテンプレートを使うと、生成したいイラストをより細かく制御できます。
1girl/1boy/1other, キャラクター名, 作品名, その他のタグを任意の順序
例えば、以下のようなプロンプトが考えられます。
画質を向上させるタグ
プロンプトの最初か最後に以下のタグを追加すると、画質が向上します。
masterpiece, high score, great score, absurdres
ネガティブプロンプト
不要な要素を指定するネガティブプロンプトも効果的です。以下は推奨されるネガティブプロンプトです。
lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry
推奨設定
CFG Scale: 5-7 (6がおすすめ)
Sampling Steps: 25-28 (25がおすすめ)
Sampler: Euler Ancestral (Euler a)
推奨解像度
以下の解像度が推奨されています。
正方形: 1024 x 1024 (アスペクト比 1:1)
横長: 1152 x 896 (9:7), 1216 x 832 (3:2), 1344 x 768 (7:4), 1536 x 640 (12:5)
縦長: 896 x 1152 (7:9), 832 x 1216 (2:3), 768 x 1344 (4:7), 640 x 1536 (5:12)
プロンプト例
上記を踏まえたプロンプト例です。
ネガティブプロンプトも忘れずに
もっと細かく制御!特殊タグ
Animagine XL 4.0 は、さらに細かい制御を可能にする特殊タグをサポートしています。
品質タグ
画像の品質を直接的に制御できます。
masterpiece
best quality
low quality
worst quality
ネガティブプロンプトを指定しない場合で同じプロンプトで「low quality, worst quality」とするとわざと雑に書いた感じの画像生成ができます。
これはなかなか面白いテクニックですね。
スコアタグ
品質タグよりも細かく品質を調整できます。
high score
great score
good score
average score
bad score
low score
"bad score, low score"と指定すると同じプロンプトでネガティブプロンプトを指定しない場合で、全然違う結果を制御的に生成できます。
時間タグ(Temporal Tags)
AICUの過去のAnimagine記事でも人気だった年代タグが更に細かくなりました。2005年以降、1年単位で特定の年代や時代を表現できます。
year 2005
year {n} (任意の年)
year 2025
これについては別途実験をしてみたいと思います!
レーティングタグ
生成される画像の安全性レベルを制御します。
safe
sensitive
nsfw
explicit
生成画像のコンテンツ安全性レベルを制御するのに役立ちます。これらのタグは、適用される法律とプラットフォーム ポリシーに従って責任を持って使用する必要があります。もちろんネガティブプロンプトに使用するというテクニックも有効でしょう。
学習情報
Animagine XL 4.0 は、以下の環境で学習されました。
ハードウェア: 7 x H100 80GB SXM5 (高性能GPU)
学習画像数: 8,401,464枚
学習パラメータ:
UNet学習率: 2.5e-6
Text Encoder学習率: 1.25e-6
スケジューラ: Constant With Warmup
Warmup Steps: 5%
バッチサイズ: 32
Gradient Accumulation Steps (勾配蓄積ステップ数): 2
学習解像度: 1024x1024
オプティマイザ: Adafactor
Input Perturbation Noise (入力摂動ノイズ): 0.1
Debiased Estimation Loss: 有効
混合精度: fp16
謝辞と資金調達
Animagine XL 4.0 の開発にあたり、Cagliostro Research Lab は Stability AI、Novel AI、Waifu Diffusion Team の技術や貢献に感謝を表明しています。
また、Moesacpe AI、Lesser Rabbit、Kohya SS、discus0434、そして早期テスターの皆様に感謝を述べています。
Cagliostro Research Lab は、今後の開発のために資金調達を再開しています。今回は暗号通貨のETHやUSDTでも募集しています。以前Ko-fiで寄付を募っていたのですが、その後資金の引き出し時にPayPalで停止された経緯があるそうです。
制限事項
Animagine XL 4.0 には以下の制限事項があります。
プロンプト形式: タグベースのプロンプトに最適化されており、自然な言語での入力は効果的でない場合があります。
人体の構造: 手のポーズや指の数など、複雑な解剖学的詳細を苦手とする場合があります。
テキスト生成: 画像内へのテキスト描画は現在サポートされていません。
新しいキャラクター: 最近登場したキャラクターは、学習データが不足しているため、精度が低い場合があります。
複数キャラクター: 複数のキャラクターを登場させる場合は、プロンプトを工夫する必要があります。
高解像度: 1536x1536 などの高解像度では、学習に使用された解像度の制約により、品質が低下する可能性があります。
スタイルの一貫性: スタイルの維持よりもキャラクターの個性を重視して学習されているため、特定のスタイルを維持するには、スタイルタグが必要になる場合があります。
ライセンス
Animagine XL 4.0 は、CreativeML Open RAIL++-M ライセンスを採用しています。
商用利用、改変、配布、私的利用が可能ですが、違法行為や有害なコンテンツの生成、差別、搾取は禁止されています。
また、ライセンスのコピーを含め、変更点を記述し、通知を保持する必要があります。
詳細なライセンス内容はこちらをご確認ください。
https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/blob/main/LICENSE.md
まとめ
Animagine XL 4.0 は、高品質なアニメイラストを生成できる強力なツールです。ぜひ、このモデルを使って、あなただけのオリジナルイラストを創造してみてください!
※アニメやゲームなどのキャラクターや商標、固有名詞を使った画像生成にについては日本の著作権法では「類似性・依拠性」が問題になる可能性があります。AICU編集部はオープンに公開されたモデル使用に関する責任は利用者にあるという立場で紹介しており、その使用や生成については十分注意することが必要です。
先日公開した「共有ComfyUI」にもAnimagine XL 4.0が搭載される可能性が高いですね!皆さんのご利用をお待ちしております。
LuC4イラストコンテスト開催中です
今回サンプルに使った「全力肯定彼氏くん[LuC4]」ですが、現在イラストコンテストを開催中です。
【参加方法】指定されたハッシュタグ「 #男子が贈るバレンタインギフト #StValentine #AIART #AICU 」、部門によって「#セツナクリエイション」「 #全力肯定彼氏くん #LuC4 」を含めた静止画もしくは動画を含むXのポストを行い、締め切りまでに本エントリーフォームにて必要事項を提出してください。
【エントリー期間】 2025年1月22日~2025年2月16日22:00まで
みんなでLuC4のキャラクターイラストをたくさん作ってLuC4のファンに届けましょう! 応募フォームは https://j.aicu.ai/C25 です。
AICUについて
AICUは「つくる人をつくる」をビジョンに掲げ、最新の生成AI、クリエイティブAI技術を皆さまにお届けしています。
📝noteでは、生成AIに関する最新情報や使い方の解説を発信しています。ぜひフォローして、最新情報をチェックしてください!
https://note.com/aicu
📩メールマガジン「週刊AICU通信」では、AI関連のニュースやトレンド、イベント情報などを毎週お届けしています。購読登録はこちらから!
https://corp.aicu.ai/ja
📚️Kindleストアでは、「月刊AICUマガジン」を配信中!AI技術の特集や深掘り解説記事が読めます。
https://j.aicu.ai/kindle
Xでも情報発信中!フォローしてね😉
https://x.com/AICUai
#生成AI #StableDiffusion #画像生成AI #AI画像生成 #プロンプト #ComfyUI #SDXL #StableDiffusionWebUI #AIイラスト #生成 #Diffusers #AnimagineXL #CagliostroResearchLab #アニメイラスト