FANZA同人クリエイターのためのStable Diffusionガイド：SD1.5、SDXL1.0、Pony Diffusionの比較と活用法

たきざわ＠AI×FANZA同人で月収452万円

2024年6月23日 12:28

この記事ではFANZA同人で毎月50万円前後を稼いでいる私が実際に使ってみて感じた「SD1.5、SDXL1.0、Pony Diffusion」のそれぞれの

・特徴
・メリット・デメリット
・どんな人がどのモデルに向いているか

について書いています。

これからFANZA同人に参入を検討している方や、すでにFANZA同人を初めて自分にはどのモデルが合ってるか知りたい方に有益な内容となっているので参考になれば幸いです。

そもそもStable Diffusion（ステーブルディフュージョン）とは

Stable Diffusionは、テキストによる説明（プロンプト）から高品質な画像を生成できる革新的なAI技術です。2022年に登場して以来、そのオープンソース性と高い汎用性により、急速に普及しました。

Stable Diffusionの特徴

テキストから画像生成：
プロンプトと呼ばれる説明文から、それに対応する画像を作成できます。
高速処理：
比較的短時間で画像を生成できます。
多様なスタイル：
写実的な画像（実際の人間に近い）からアニメ調まで、幅広い表現が可能です。
カスタマイズ性：
様々なモデルやファインチューニングにより、特定の目的に特化させることができます（自分だけのモデルを作って作品展開ができますがこれはかなり上級者向け）

FANZA同人制作におけるStable Diffusion活用のメリット

現在のFANZA同人は「なんか楽して儲かりそうだから自分もやってみたい」という理由で参入している方が多いイメージですが、実際に参入してみると競合が日に日に増えるので難易度は高いです。

そのため、参入することに大いにメリットがある人は「もともとFANZA同人に出品したい願望があり、こんな作品があれば売れるよな〜とう構想はあったけど自分には画力がまったくないから諦めてた」という人が参入するととてつもなくメリットが大きいです。

かなり主観的な意見ですが、FANZA同人を見ているとそんな感じがします。

Stable Diffusionの主要タイプ概要

Stable Diffusionにはさまざまなバージョンやカスタムモデルが存在しますが、ここではFANZA同人制作に特に関連する3つの主要タイプについて解説します。

1.SD1.5

SD1.5は、Stable Diffusionの基本となるモデルで、最も広く使われているバージョンの一つです。

特徴

解像度：標準で512x512ピクセル
汎用性：幅広い種類の画像生成に対応
処理速度：比較的高速
安定性：安定した出力が可能

SD1.5の強みは、その汎用性と安定性にあります。初心者でも扱いやすく、さまざまなジャンルの画像生成に適しています。FANZA同人制作では、キャラクターデザインの初期段階やアイデア出しに特に有効です。

2.SDXL1.0

SDXL1.0は、SD1.5の後継バージョンとして2023年に登場しました。より大規模なモデルを採用し、高品質な画像生成を実現しています。

特徴

解像度：1024x1024ピクセルまで対応
画質：より詳細で高品質な画像生成が可能
表現力：複雑な構図や細かいディテールの表現に優れる
処理要求：SD1.5と比べてより高い処理速度が必要

私自身、2024年５月までは「SD1.5×LORA」を駆使してFANZA同人で作品を出品していましたが、2024年6月からはSDXL1.0を使っています。

結論、SDXL1.0最高です！！！

3.Pony Diffusion

Pony Diffusionは、アニメやマンガ調の画像生成に特化したカスタムモデルです。

特徴

スタイル：アニメ・マンガ調に最適化
キャラクター生成：2次元キャラクターの作成に強み
学習データ：アニメ風のイラストで学習
表現：誇張表現やポーズなど、アニメ特有の要素を理解

SD1.5やSDXL1.0よりもプロンプト入力にかなりクセがあります。
しかし、SD1.5やSDXL1.0ではできなかった構図やポージング・衣装などを生成できるので極めたらFANZA同人内で大きく差別化できるはずです。

各モデルの選択と活用

これらのモデルは、それぞれに長所があり、制作の段階や目的によって使い分けることが効果的です：

アイデア出しや素早いラフ生成：
（難易度☆）SD1.5
高品質な完成イラストや背景：
（難易度☆☆）SDXL1.0
アニメ調キャラクターやシーン：
（難易度☆☆☆）Pony Diffusion

各タイプの特徴比較

1.画質と解像度

SD1.5:

標準解像度: 512x512ピクセル
画質: 一般的に良好だが、細部の表現には限界がある
アップスケーリング: 外部ツールを使用して拡大可能だが、品質低下のリスクあり

SDXL1.0:

標準解像度: 1024x1024ピクセル
画質: SD1.5より大幅に向上し、細部の表現も優れている
高解像度対応: より大きなサイズでの生成も可能で、品質維持能力が高い

Pony Diffusion:

解像度: SD1.5ベースのため、基本は512x512ピクセル
画質: アニメ調に最適化されており、2次元キャラクターの表現に優れる
スタイル一貫性: アニメ風の画像生成において高い一貫性を保持

2.生成速度

SD1.5:

速度: 3つの中で最も高速
処理時間: 標準的なGPUで数秒から数十秒程度

SDXL1.0:

速度: SD1.5より遅い
処理時間: SD1.5の2〜3倍程度かかることが多い
要求リソース: より高性能なGPUが必要

Pony Diffusion:

速度: SD1.5とほぼ同等
処理時間: アニメ調に特化しているため、同ジャンルの生成では効率的

モデル別の利点

1.SD1.5の利点

SD1.5は、Stable Diffusionを始めたばかりの初心者にとって最適なモデルです。

主な利点:

使いやすさ:
比較的シンプルなプロンプトでも良好な結果が得られます。
処理速度:
高速な画像生成により、試行錯誤が容易です。
リソース要求:
比較的低スペックのPCでも動作可能です。
豊富な情報:
オンラインで多くのチュートリアルや使用例が見つかります。

注意点：

細部の表現には限界があるため、完成品としての使用には向いていません。
著作権や倫理的な問題についても学びながら使用することが重要です。

2.SDXL1.0の利点

高解像度:
1024x1024ピクセル以上の高解像度画像生成が可能です。
細部表現:
複雑な質感や細かいディテールの再現性に優れています。
構図の理解:
より複雑な構図や多要素の画像生成が可能です。
テキスト生成:
画像内のテキスト生成能力が向上しています。

注意点:

高性能なGPUが必要で、処理時間も長くなります。
より詳細なプロンプト設計が求められ、スキルの向上が必要です。

SDXL1.0はSD1.5の完全上位互換という感じですね。

3.Pony Diffusionの利点

アニメ調最適化:
2次元キャラクターの表情、ポーズ、衣装表現に優れています。
スタイル一貫性:
アニメ風の画像生成において高い一貫性を維持します。
効率的な生成:
アニメ調画像の生成速度が比較的速いです。
特化プロンプト:
アニメ用語や表現に対する理解が高いです。
変態（hentai）に特化してる：
プロンプトのクセがありますがhentai画像のクオリティはスゴいです….!

注意点:

リアルな表現や非アニメ調の画像生成では劣ります。
アニメ特有の誇張表現を理解しているため、適切なプロンプト設計が重要です。

モデルごとのメリットとデメリット

結局どのモデルを使えば良いの？

人によって相性があるので、３つすべてのモデルをcivitaiの商用利用可能なCheckPointからダウンロードして生成しましょう。

参考までに以下はこれまでの私の流れです。

1.Stable Diffusionを使い始めたばかりのとき（2023年７月）

「ふむふむ。SD1.5というのが使ってる人も多くてLORAが多いから良い。」

「使ってる人が多いと何か安心感があるからSD1.5にしよっと」

2.SD1.5に飽きてきた（2024年5月）

「う〜ん…SD1.5だと似たような構図・LORAばかりで飽きてきたし、作品も似たようになってきたからまずいな…」

「え？Stable Diffusionってこんなに種類があるの？」

「SDXL1.0？Pony Diffusion？どういうこと？」

「Pony Diffusionのプロンプトクセ強すぎて安定しないムズいー！！！」

「SDXL1.0はLORA使わなくてもSD1.5より全然良いじゃん！よし！しばらくはSDXL1.0で作品創りしよっと」

現在2024年6月23日に至る。

こんな感じなので、とりあえず一通り触ってみて、自分が一番生成しやすいのをメインに作業すれば良いかと思います！