見出し画像

Pony Diffusion研究2 scoreとは

※ 本項目のモデルはfp8_weightでロードしている

 Pony Diffusion V6では、絵の品質をscoreで表記している。上位10%がscore9, 20%がscore8_up, 30%がscore7_upらしいが、実際のところタグの付け方を間違えていたらしく、

score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up

 ――が推奨されている。実際のところscore_6, score_5, score_4はネガティブに入れても構わないので、概ね

score_9, score_8_up, score_7_up

 ――で十分な気がする。実際どうよってのがこれ。

score_9 score_8_up score_7_up score_6_up, rating_safe, 1girl, iht, Negative prompt: source_pony, realistic,, score_5, score_4 Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 2490487574, Size: 512x512, Model hash: 67ab2fd8ec, Model: ponyDiffusionV6XL_v6StartWithThisOne, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, VAE hash: b08801b824, VAE: pppanimixVAE_XL.safetensors, Clip skip: 2, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "score_9 score_8_up score_7_up score_6_up , score_8_up score_7_up score_6_up, score_7_up score_6_up, score_6_up", Y Type: Prompt S/R, Y Values: "iht, ,jnu, juy, jvj", Version: v1.10.1
score_9 score_8_up score_7_up, rating_safe, 1girl, iht, Negative prompt: source_pony, realistic, score_6, score_5, score_4 Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 2490487574, Size: 512x512, Model hash: 67ab2fd8ec, Model: ponyDiffusionV6XL_v6StartWithThisOne, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, VAE hash: b08801b824, VAE: pppanimixVAE_XL.safetensors, Clip skip: 2, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "score_9 score_8_up score_7_up , score_8_up score_7_up, score_7_up", Y Type: Prompt S/R, Y Values: "iht, ,jnu, juy, jvj", Version: v1.10.1

 結局の所score_7までで十分な気がする。score_7_upだけだと二次元感が強くなるが、score_6_upだけでも余りかわらない。

 そこでscoreタグを削ってみた。

score_9 score_8_up score_7_up, rating_safe, 1girl, iht, Negative prompt: source_pony, score_5, score_4, score_6,realistic Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 2490487574, Size: 512x512, Model hash: 67ab2fd8ec, Model: ponyDiffusionV6XL_v6StartWithThisOne, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, VAE hash: b08801b824, VAE: pppanimixVAE_XL.safetensors, Clip skip: 2, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "score_9 , score_8_up , score_7_up", Y Type: Prompt S/R, Y Values: "iht, ,jnu, juy, jvj", Version: v1.10.1

 どうも平面的になるかにscoreタグの数の方が影響している気がする。これはSDXLの特性か、WebUIの重みづけの特性か分からない。ComfyUIはFLUX.1の検証にもっていかれているから検証できていない。

score_9, rating_safe, 1girl, iht, Negative prompt: source_pony, score_5, score_4, score_6,realistic Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 2490487574, Size: 512x512, Model hash: 67ab2fd8ec, Model: ponyDiffusionV6XL_v6StartWithThisOne, FP8 weight: Enable for SDXL, Cache FP16 weight for LoRA: True, VAE hash: b08801b824, VAE: pppanimixVAE_XL.safetensors, Clip skip: 2, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "score_9, score_9 score_8_up, score_9 score_8_up score_7_up", Y Type: Prompt S/R, Y Values: "iht, ,jnu, juy, jvj", Version: v1.10.1

realistic

 二次元に調整された派生モデルではなく、オリジナルのpony diffusionの仕上がりに大きな影響を及ぼすのはrealisticになる。派生モデルでは影響しないケースがある。

realisticをnagative promptに追加した場合と追加しなかった場合の比較

negative promptにrealisticを入れた場合と入れなかった場合(XYZ plotはnegative promptに作用しているので、realisticを排除した方がrealistic)

 negative promptにrealisticを入れないと全体的にケバい


いいなと思ったら応援しよう!