見出し画像

Pony Diffusion研究3 隠し三文字タグ (1)

 
Pony diffusionには3文字に圧縮された、隠しタグが存在するという。

 しかし現実的にaaaからzzzまで調べるのは無理。17576通りある。取りあえずa-cまで調査した結果を書くと、三文字タグでもそのまま単語が適用されるものは隠しタグには使われていないらしい(これはこれでまとめよう)

  • bar バー

  • bat コウモリ

  • bib よだれかけ

  • cat 猫

  • cap キャップ

solo, light blue long hair, (bar:1.4), score_9, score_8_up, score_7_up, rating_safe, source_anime Negative prompt: source_pony, source_furry, source_cartoon, rating_explicit, rating_questionable, realitics, score_6 Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 3063565096, Size: 1024x1024, Model hash: c6a7945b02, Model: waiANINSFWPONYXL_v70, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, Clip skip: 2, Emphasis: No norm, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "bar, bat, bib, cat, cap, ", Y Type: Checkpoint name, Y Values: "pony\\waiANINSFWPONYXL_v70.safetensors [c6a7945b02],pony\\autismmixSDXL_autismmixPony.safetensors [821aa5537f],pony\\ponyDiffusionV6XL_v6StartWithThisOne.safetensors [67ab2fd8ec]", Version: v1.10.1


 など

 しかし、スタイルに影響してしまう単語が存在する

  • abs (abdominal muscles) 割れた腹筋

  • boo (ハロウィーンの幽霊が出てくる)

  • COD (call of duty)

  • con (comic conに引きずられる)

  • car, bmw (実写が混じりやすくなる)

  • boa (ボア・ハンコックになる)

  • wet (概ね水辺になる)

  • cub (age downする)

  • aua (宝鐘マリン)

  • bea (スポーツブランドっぽいが、わからない)

  • goo (スライム化)


 隠しタグには、強いタグと弱いタグが存在するようで、存在しないタグも前後で補間されているので分かりにくい。Pony diffusionはtypoに弱いので補完されないと思っていたがどうやら一文字違いの強いタグの影響を受けるらしい

 基本的には、2文字が一致すると似たような画像が出てくる感じ(固有タグが途中で混じっていたりクラスタが複数存在するケースがある)これはタグが存在しないのに、CLIPの誤字訂正機能が働いた結果sub seed的な動作を起こしていると推測する。

 強いタグにはnegative promptを無視して環境に及ぼす厄介なタグが存在する。強いタグは、派生モデルでも効く。しかしポリコレにも配慮しているな(すっとぼけ)

例:

  • abs 腹筋を見せてくる

  • ail 足の爪を出してくる

  • amu 夢見りあむ化

  • bif 男性化

1girl , cle, score_9, score_8_up, score_7_up, score_6_up, rating_safe, source_anime Negative prompt: source_pony, source_furry, source_cartoon, rating_explicit, rating_questionable Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 67407272, Size: 512x512, Model hash: 67ab2fd8ec, Model: ponyDiffusionV6XL_v6StartWithThisOne, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, Clip skip: 2, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "cle, , aaz, bbv, bbw, bif, czz", Y Type: Checkpoint name, Y Values: "pony\\ponyDiffusionV6XL_v6StartWithThisOne.safetensors [67ab2fd8ec],pony\\autismmixSDXL_autismmixPony.safetensors [821aa5537f],pony\\ebara_pony_2.safetensors [b2f773d7b7],pony\\waiANINSFWPONYXL_v70.safetensors [c6a7945b02],pony\\whiteUnicorn_v30.safetensors [7bc46d9c2b]", Version: v1.10.1

 burってなんだろ。他の単語は意味があるはずだが(cod=Call of duty)

1girl standing, bur, score_9, score_8_up, score_7_up, score_6_up, rating_safe, source_anime Negative prompt: source_pony, source_furry, source_cartoon, rating_explicit, rating_questionable Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7.5, Seed: 1500136280, Size: 1152x896, Model hash: 67ab2fd8ec, Model: ponyDiffusionV6XL_v6StartWithThisOne, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, VAE hash: b08801b824, VAE: pppanimixVAE_XL.safetensors, Clip skip: 2, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "bur, cub, cod, bib", Version: v1.10.1

 promptが長くなると影響が弱くなるので、その場合、強調すると良いみたい。

score_9, score_8_up, score_7_up, score_6_up, rating_safe, source_anime 1girl swings down the sword, (elf, 20yo girl, adult) wearing camouflage gray blue stripe samurai clothes on sky blue pelvic curtain, normalemerald green, wink eyes, sweatdrop, dark blonde straight, antenna hair flaps ponytail hair between eyes shiny long, [[small breasts]] skinny, in medieval bazzar blue sky, breeze, vanishing point. BREAK ((aaz)) Negative prompt: source_pony, source_furry, source_cartoon, rating_explicit, rating_questionable Steps: 25, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7.5, Seed: 1885125065, Size: 1216x832, Model hash: 67ab2fd8ec, Model: ponyDiffusionV6XL_v6StartWithThisOne, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, VAE hash: b08801b824, VAE: pppanimixVAE_XL.safetensors, Clip skip: 2, ENSD: 31337, Emphasis: No norm, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "aaz, bur, cub, cod, bib, bif", Version: v1.10.1

 なお、sourceとratingで効かなくなるタグが割と存在する(検証が進まない最大の理由)傾向としては、rating_explicitよりraiting_safeの方がタグがきかない。

 全部調べるのが面倒なので戦略を立ててみた。似たような絵をグルーピングし不確かなものを削除する。恐らく、この辺りのタグが恐らく存在しないから。この抽出に類似度検出を使ってみたが上手く処理出来ない。重要なタグが真ん中に収束している。そうすると目視の方が早い気がする(見落としも多いけど)


いいなと思ったら応援しよう!