階層別マージについて各階層ごとの影響について調べました IN編
前書き
サンブンノイチです。
男の子のキャラクターを生成するとき、通常のモデルでは意図しない女体化や女装が頻繁に起きてしまうので
それを避けるために自分用のマージモデルを制作しています。
その過程で、階層別の変化について検証したため簡単なレポートを作ることにしました。何かのお役に立てば幸いです。
検証方法について
使用モデル
A: Counterfeit V2.5
言わずと知れたイラスト系モデル。こちらがベース
https://huggingface.co/gsdf/Counterfeit-V2.5
B: BasilMix
リアル系の画像が出力できるモデル
https://huggingface.co/nuigurumi/basil_mix
この二つを使用し、
階層ごとにAが0%、Bが100%という設定にします。
この画像のように、M_00階層に対してはA = 0, B = 1と設定し、
その他の階層に対してはA = 1, B = 0と設定しています。
この設定を適用したマージモデルを作り、
Counterfeit V2.5で出力した画像
BasilMixで出力した画像
検証用モデルで出力した画像
これらを見比べて、M_00の変更が画像のどこに影響が及んだかを考察するというアプローチです。
※あくまでシロートの思いつきなので、検証方法の適切性を保証することはできません。
使用したプロンプト及びコンフィグは下記の通りです。
検証結果
では、M_00の出力結果を確認します。
M_00については色々なサイトで「全体に影響」する旨紹介されていることが多いですが、今回は背景部分がBasilMixにかなり寄っていますね。
Counterfeitの出力と比べて大味な描き込みになっていて、
背景部分のオブジェクトの数やカラーバリエーションが激減しています。
今回のようにタイプの異なるモデルをマージする場合、慎重に扱わないとコンセプトの統一感が失われてしまうかもしれません。
(あえて崩す、みたいなクリエイティブなアプローチには活用できそうですが…)
続いて、細部に影響すると言われている表層部の結果を確認します。
表層部
最深層であるM_00の変更結果と対照的に、ほとんど間違い探しみたいな状態ですね。IN_00に至っては元絵と全く同じように見えます。
IN_01以降で若干の変化が見られるようになり、
手指や服の一部、足の角度など少し変わっています。
ただし、BasilMixの影響を思わせる要素は見当たりません。
しいて言えばパンツのセンタープレスの強調くらいでしょうか。
基本的に元モデルの良さは維持できそうなので、このように細部のデティールを取り込みたい場合は大胆に使ってもいいかもしれません。
続いて中層部を確認していきます。
中層部
このあたりからわかりやすい変化がありますね。
特に上半身部分の採用色の減少はBasilMixの影響を思わせます。
青色のリボンやインナーのベストに採用されていたカラシ色はほぼ使われなくなり、全体的に黒系統の色使いで統一されています。
帽子の解釈や髪のハネなど、頭部にも変化が見られ、
特にIN_07では様々な箇所でBasilMixに寄っており、
帽子が外れる
口を結ぶ
ポケットに手を入れる
など、構図にも影響が現れるようになってきました。
続いて、最深層を確認していきましょう。
最深層
IN_08に関してはIN_07で言及した点に加えて、
右手が下がり、上半身の装飾がほぼ無くなるなど
大きくBasilMixの出力画像に寄ってきたのがわかると思います。
しかし、興味深いことにIN_09以降ではキャラに対するアプローチは大幅に減り、ライティングのニュアンスや背景部分の微妙な変更など、限定的な差に留まりました。
他サイトでは色彩などへの影響を指摘されていることもあり、
IN_10やIN_11に関しては、被写体に対しての有意な影響はほぼないと捉えてよさそうですね。
活用シーンとしては、元モデルのキャラクターデザインを崩さず、色合いや雰囲気などを取り入れたい場合に調整するといいかもしれません。
OUT側について
今回の検証でもう一つ興味深かった点として、
IN側と比べてOUT側の変更は影響がかなり大きかったことが挙げられます。
もちろんOUT側についても紹介させていただきますが、
このまま続けて書くと縦に長くなりすぎてしまうので、OUT側パラメータの検証については次回、記事を分けて紹介したいと思います。
この記事が気に入ったらサポートをしてみませんか?