![見出し画像](https://assets.st-note.com/production/uploads/images/150825066/rectangle_large_type_2_61872b171428db992d135ccb2e6095b3.png?width=1200)
LayerDiffuseでキャラの切り抜きと背景固定方法
Stable diffusionで背景固定と調べるとinpaintなどがでますが、そういった手間は不要で、ワンクリックぐらいの勢いで背景固定ができないかを調べているとLayerDiffuseで背景固定とキャラの透過処理を簡単にできるようになりました。
LayerDiffuse
透過画像またはレイヤー構造を保った画像が生成できるStable diffusionで使える拡張機能です。
下記簡単に導入できるEasySdxWebUiからforgeを起動することで初めからあります。
LayerDiffuseがない方は、「Extensions」タブ内の「Install from URL」に以下のURLを張り付けて、installボタンで導入してください。
https://github.com/layerdiffusion/sd-forge-layerdiffuse
checkPointによって透過処理できる等があります。
下記参考にしてください。
LayerDiffuseで使用するベースのキャラ
![LayerDiffuseで使用するベースのキャラ](https://assets.st-note.com/img/1723707283926-LhzlynusGy.png?width=1200)
早く連載再開してほしいハンターハンターのキルア君です。
プロンプトを入れた際に上記画像が生成されるので彼をベースでLayerDiffuseを使用していきます。
LayerDiffuseの設定パラメータについて
Method:SDXL用とSD用があります。
Only Generate Transparent Image(Attention Injection)-画像透過処理
Only Generate Transparent Image (Conv Injection)-画像透過処理
From Foreground to Blending-キャラ固定でプロンプトで背景等設定
From Background to Blending-背景固定でプロンプトでキャラ等設定
Weight
デフォルトは1だが、内容によっては、ベースが改変されるケースがある。
低すぎると透過処理が中途半端になります。
Stop At
デフォルトは、1で0だと中途半端な透過処理で、0.5で完全な透過処理ができればできなかったりで、1だと完璧な透過処理を実施。
低すぎると透過処理が中途半端になります。
生成が2枚でます
生成後に2つの画像がでます。
グレーとホワイトグレーの四角が多数あるものと完全透過処理されているものが生成されます。
outputに保存されるのが、四角が多数あるものです。
透過処理のは、まだフォルダーに保存されないので、必ず生成した際に手動で保存しましょう。
最悪忘れてしまった場合でも下記になります。
c/user/ユーザー名/AppDate/Local/Temp/gradio
ただプログラムやツールが実行されると、一時ファイルはセッション終了時やツールの終了時に削除されることもありますので必要なものは忘れず保存しましょう。
Method:Only Generate Transparent Image (Attention Injection)
Only Generate Transparent Image(Attention Injection)は、画像生成のプロセスで、背景や指定された部分が完全に透明な画像のみを作成することを意味します。
Weight:1で実施。
![Method:Only Generate Transparent Image (Attention Injection)](https://assets.st-note.com/img/1723708155952-L3Wa99Nsw8.png?width=1200)
ん??ベースと違ったキャラでなおかつ顔だけだったものが全身映ってます。
Weightを1から0.5に実施。
![Method:Only Generate Transparent Image (Attention Injection)](https://assets.st-note.com/img/1723708655693-wKxPlqPZtt.png?width=1200)
近づきましたが、ちょっとかっこよくなっている気がするので画像を比較してみます。
![Method:Only Generate Transparent Image (Attention Injection)のベースとの比較画像](https://assets.st-note.com/img/1723708729223-upuFUPAul2.png?width=1200)
LayerDiffuseの方がかっこいい!?影や色彩の影響・・・・かな。
Weight:0.4で実施。
いい感じで近い。
![](https://assets.st-note.com/img/1723709352776-WBBnxLbTKh.png?width=1200)
Weight:0.6で実施。
変な文字と顔ちょい違いますね。
![](https://assets.st-note.com/img/1723709379210-YSVk0DuhY6.png?width=1200)
Only Generate Transparent Image (Conv Injection)
「Conv Injection」は「Convolutional Injection」の略で、畳み込み層の注入を指します。
畳み込み層を使うことで、画像生成モデルがより詳細で精密な画像を生成できるようにします。
特に、画像の一部が透明である場合、その透明部分のエッジや質感を正確に処理するために用いられるとのことです。
Weight1で実施。
全然違う・・・だれ?
![Only Generate Transparent Image (Conv Injection)のWeight:1](https://assets.st-note.com/img/1723709794318-DnIeTH6yOn.png?width=1200)
Weight0.5で実施。
変なテキストと顔だけでないので、Only Generate Transparent Image(Attention Injection)と勝手が違います。
![Only Generate Transparent Image (Conv Injection)のWeight:0.5](https://assets.st-note.com/img/1723709555690-Q5MoUgKRiO.png?width=1200)
Weight:0.25で実施。
やっとでました。
![Only Generate Transparent Image (Conv Injection)のWeight:0.25](https://assets.st-note.com/img/1723710357051-TNISHSHVMc.png?width=1200)
ベースとの比較。
![Only Generate Transparent Image (Conv Injection)のベース比較](https://assets.st-note.com/img/1723710411253-rcOqPhCG7N.png?width=1200)
ベースよりキルアっぽいので、割とありがたい。
From Foreground to Blending
ベース画像は下記透過処理のキャラ画像を使用します。
![From Foreground to Blendingのベース画像](https://assets.st-note.com/img/1723712030659-mxP2pXh5tw.png?width=1200)
キャラの記載していたプロンプトを削除し、hotelのみ入れて実施。
Weight:1 Stop as:1
![From Foreground to BlendingのWeight:1](https://assets.st-note.com/img/1723712158361-x6hxPtF18R.png?width=1200)
Weight:0.9
![From Foreground to BlendingのWeight:0.9](https://assets.st-note.com/img/1723712225482-Z27bLM98t4.png?width=1200)
Weight:0.8
![From Foreground to BlendingのWeight:0.8](https://assets.st-note.com/img/1723712262226-Rqmx8nrORU.png?width=1200)
背景はっきりでましたが、Weightを減らすごとになぜ照れていくキルア君。
パラメータや入れるキャラによって出来が違います。
結構ガチャ要素がありますが、使う事はあまりないかなーと思っていますが、アイデア次第。
五条悟先生で手がおかしいのですが同じように実施。
![From Foreground to Blendingでの五条悟先生のベース](https://assets.st-note.com/img/1723712561967-fw0x9PIEtS.png?width=1200)
![From Foreground to Blendingでの五条悟先生の結果](https://assets.st-note.com/img/1723712596279-kY5wI6fzj2.png?width=1200)
まあいい感じ。
From Background to Blending 背景固定
ベース画像は下記画像を使用します。
![From Background to Blendingの背景ベース](https://assets.st-note.com/img/1723712664655-RD8sZJjDGP.jpg?width=1200)
私自身が求めていた背景固定の部分です。
Weight:1 Stop as:1
![From Background to BlendingのWeight:1](https://assets.st-note.com/img/1723712739162-vMXici54zJ.png?width=1200)
キャラ変わりすぎだけどかっこよくなりすぎです。
あとなぜ横を向く・・・・SEED値によって変化しそう。
Weight:0.9
![From Background to BlendingのWeight:0.9](https://assets.st-note.com/img/1723712856283-yPbBNHN7sA.png?width=1200)
結構近いのと結構かっこいい。
多分背景の度合いによっておかしくならないようキャラが背景に合うように生成されていると推察。
Weight:0.8
また横を向くのか・・・・。
![From Background to BlendingのWeight:0.8](https://assets.st-note.com/img/1723712863640-6UldtAgEYB.png?width=1200)
Weight:0.7
full bodyの指示は与えていませんが・・・。
![From Background to BlendingのWeight:0.7](https://assets.st-note.com/img/1723712899145-mxuJtZRg8G.png?width=1200)
Weight:0.6
![From Background to BlendingのWeight:0.6](https://assets.st-note.com/img/1723712925518-0cERcrlQzg.png?width=1200)
Weightが低くなると背景とキャラの度合いが薄くなります。
現状0.9がいいのかなーですが、ケースバイケースかと思います。
Weight:1.5
1以上価値がないのかもしれません。
![](https://assets.st-note.com/img/1723713861179-h68LPEofA9.png?width=1200)
Bach Count:10で生成した結果。
![](https://assets.st-note.com/img/1723714858313-vrJd6VIf5R.png?width=1200)
原型のベースモデルのプロンプトと同じやつ出ないですね・・・。
背景固定はあってますが、背景固定かつキャラ固定ではない感じですが、別のキャラでやるとそのままのキャラが出たりでなかったりなのでcheckPointにLoRAを使う使わないで変化するかと推察します。
From Background and Blending to Foreground
上記などで生成された画像と背景の画像を使って背景を削除して透過画像を生成します。
使う画像は下記になります。
Backgroundに下記画像を入れます。
![](https://assets.st-note.com/img/1723714025570-PeVrzFHl5X.jpg?width=1200)
Blendingに下記画像を入れます。
![](https://assets.st-note.com/img/1723714047333-RTRKw0zUsO.png?width=1200)
実施の結果が下記です。
![](https://assets.st-note.com/img/1723714181865-4pkel5ChMC.png?width=1200)
これをどう活用するかわかり次第追記します。
だから何って感じなのが印象です。
LayerDiffuseでキャラの切り抜きと背景固定方法の結論
背景固定ができますが、その背景によせてキャラが生成されると思います。
さらにcheckPointやLoRAの有無によってかなり変化しますが、LoRAでキャラ設定している場合は割とキャラが固定されやすいです。
いいなと思ったら応援しよう!
![nobin](https://assets.st-note.com/production/uploads/images/169332658/profile_89e07f4f31bdd24887614bb95ef64f43.png?width=600&crop=1:1,smart)