自作マージモデル『NameTakeMix』を作ってみた(モデル公開)
相変わらずnote不精ですね。すみません。
前回のnoteから特に心境が変わっていないとも言えます。
AIへの風当たりは強く、好きなものを堂々好きと言いづらい雰囲気を感じています。こんな世の中じゃPOISON。
とはいえ、好きなものは好きだからしょうがないとも約四半世紀前からよく言われてきました。
やりたいことはやってみるかぁとなったところで、AI絵をはじめた当初目標だった自作マージモデルを作ってみました。
特徴
StableDiffusion 1.5ベース
柔らかめの明るい色合い+主線が強めのパッキリアニメ塗りモデル
ディテールはかなりフラット
男性キャラもなるべく出やすく
ゲームアセットを出力したい人などにおすすめ
という感じです。
過去にTRPG卓の背景をMidjourneyに生成させてみた→最大の欠点と呪文の参考などという記事を書いているように、TRPGをする人間のため、立ち絵やアイコン、アイテム、背景なんかを好みのテイストでどんどん出力できるモデルがあればいいなあと思っていたので、その方向性を目指しています。
もちろんTRPGのみならず、その他インディーゲーム用アセットなどにも使用できます。
が、ちょっと癖のあるモデルに仕上がったので、説明書代わりにこのnoteを書いています。
たぶんぼくも設定を忘れるので。
基本の推奨設定
パラメータ
Steps: 20~30
Sampler: DPM++ 2M Karras
CFG scale: 9
Denoising strength: 0.6~0.7
Clip skip: 2
Hires upscale: 2
Hires steps: 10~15(最初のStepの半分)or 0(最初のStepと同値)
Hires upscaler: 4x-AnimeSharp
クオリティタグ
Positive:
masterpiece, best quality
Negative:
worst quality, low quality, normal quality
推奨TI
EasyNegativeV2
negative_hand-neg
VAE
何も焼き込んでいないので、お好きなVAEをご利用ください。
この記事にある画像はすべてCounterfeit-V2.5.vae.ptです。
クオリティタグは最近いらないモデルが増えてきていますが、残念ながらこのモデルはクオリティタグの有無でかなり出力が変わります。
これを元に、それぞれ出力したいものに合わせて調整していきます。
ライセンス・免責
基本的にはCreativeML OpenRAIL-Mライセンスに準拠しています。
モデル自体・モデルを使用して得られた生成物・マージ及び複製等によって得られた派生物について、犯罪・非倫理的行為及び医療を目的にした利用等に該当しない限り、商用を含めて自由に利用が可能です。
例えば、
TRPGやゲームの立ち絵や素材を作る
立ち絵・素材を使用したTRPG動画で収益を得る
素材を同梱したシナリオを公開/販売する
素材を使用したゲームを公開/販売する
素材集を作って公開/販売する
自作小説の表紙/挿絵を作る
画像を使用した小説同人誌を販売する
AIイラスト集/マンガ等の作成に本モデルを使用する etc…
ただし、何かしらの問題や不利益が発生してもモデル製作者は一切の責任を負いません。 ご利用の際は常識の範囲内かつ自己責任でお願いします。
商用利用可だからといってAI画像利用不可のプラットフォームで販売するなどしてトラブルが起きた、というような話に制作者は関与しません。
本モデルの公開について、モデル製作者が不適切と判断した場合あるいは何らかの不都合が生じた場合は予告なく公開を中止します。
個人的な感情で言えばこのモデルそのものの販売は控えてほしいですが、無料公開しているモデルをわざわざ有料で買う人はいないだろうと信じてALL OKです。
連絡先
本モデルについてのお問い合わせ・ご指摘等がありましたら下記へご連絡ください。
Twitter:@Name_Take
ダウンロード
こちらからどうぞ。
別にやましいことはないですが、Civitaiやhuggingfaceでの公開は(英語で対応したりするのが)面倒なので考えていません。
永遠にベータ版です。
出力イラストタイプごとの推奨設定
主にCFG Scaleを細かく調整します。何かうまく行かないなというときはCFG Scaleをいろいろいじってみてください。
立ち絵・全身絵
Width512×Height768~1024
CFG scale: 9~11
Hires upscale: 1.5~2
基本的には推奨設定と同じですが、短辺512pxからの拡大でないとどうにも下半身の出力が怪しいです。
CFGスケールはあげるほど主線が太めになっていきます。
また、長髪やカールヘアにしてもそれなりに男性が出やすい調整になってはおりますが、なかなか出ない場合は1 maleや1 boyを強調する、masculine features(男性的)を追加するなどしてみてください。
背景込みの1枚絵・バストアップ
CFG scale: 7~9
Hires upscale: 1.5~2
下半身が入らないならそれほど出力サイズにこだわる必要はありません。
が、サイズをあげるほど顔以外が崩れやすいことに加えて、女性に近づいていく癖があるので、CNやプロンプトで補強してください。
番外編:2人以上出力する
CFG scale: 13前後
OpenPose等での出力制御を行わない場合は、これくらいスケール高めのほうが安定します。9くらいでも描いてはくれますが、要ガチャです。
背景
推奨プロンプト: visual novel background, no people
Steps: 30~50
CFG scale: 11~13
Denoising strength: 0.5~0.8
Hires steps: 15~25(最初のStepの半分)
キャラと出し方が大いに変わります。Step数をしっかり確保して、Hires.Fixで一気に書き直します。Denoising strengthを0.8もとると、最初の絵は参考程度の残り方になりがちですが、何度かガチャする気持ちで出していただけるといいかなと思います。最初の絵をなるべく残したい場合はDenoising strength0.5くらいから調整してみてください。
アイテム・アイコン
推奨プロンプト: 2D game icon(2D game asset), still life, no human, knolling
Sampler: Euler a
CFG scale: 10~15
Hires.Fix不要(したければTiled Diffusionなどで)
もともとキャラを描きたいモデルなので、キャラクターをどうしても描きがちですが、サンプラーをEuler aにすると抑制できます。
そもそもアイテムをAIで出すという時点で、世に素材等ではあまり出ていないものを出力したいというニーズかと思いますので、どうしてもAIでは認識しづらかったり、出力する人間側に語彙が少なかったりで打率はやや低めですが、プロンプトにほしい要素をたくさん詰め込んだりガチャガチャしまくってください。
おわりに
本記事の画像は、モデルのサンプルのためにすべてt2i+Hires.Fixのみで出力されており、TIは使用しておりますがLoRAやControlNetでの出力調整や制御、ならびにInpaintや加筆での修正を行っておりません。
はじめてのモデル公開でまだまだスキル不足が目立ちますが、自分の好きな絵が出せる+素材として使いやすいを目指しましたので、いろいろ触って楽しんでいただけましたら幸いです。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?