![見出し画像](https://assets.st-note.com/production/uploads/images/124444133/rectangle_large_type_2_4be53850b923bdcddc71bd09015735f9.png?width=1200)
コピー機学習法による絵柄LoRAの検証その2
前回はAIが出力した一枚の画像を学習とそれを絵描きさんが自分の絵柄でトレースした差分を学習させる手法でコピー機学習法をしていました。
今回は『1枚のイラストを極力その人の個性を無くして別の絵柄(AIのプレーンな絵柄)に修正し、その差分を学習させることで絵柄を抽出する』l試みを行いたいと思います。
とりにくが描いた絵
![](https://assets.st-note.com/img/1702335179993-lEdeuhnzpw.png?width=1200)
SDHK04に描かせた絵
![](https://assets.st-note.com/img/1702335191995-bvxMB7O4ZH.png?width=1200)
この二つの差分を抽出してみました。以下結果。
![](https://assets.st-note.com/img/1702335255527-61QtYk9sm2.png)
![](https://assets.st-note.com/img/1702335261095-43hfYBjfNZ.png)
![](https://assets.st-note.com/img/1702335268076-UfrKsJTtRb.png)
おお、綺麗なイラストとして出力される打率は低いですが絵柄自体は抽出されています。という訳でまたまたX(旧Twitter)で検証用イラストを募ってみました。
フォロワへ
— とりにく (@tori29umai) December 11, 2023
「これがわいの絵や!!!」って感じの自分の絵柄つよつよのキャラ立ち絵を検証用にお貸し¬eに引用許可をいただけませんか?
とりにくより
以下はその検証結果になります。
なお、許諾なく特定個人の絵柄を加工したり学習することは無用なトラブルの元です。再現実験する場合は自分の絵で行うか、必ず許諾を得てから行ってください。
比較対象
以下は各LoRAなしで生成したイラストです。
![](https://assets.st-note.com/img/1702434131261-kYuLSQkWoS.png)
![](https://assets.st-note.com/img/1702434206935-ttgxkOAkKJ.png)
![](https://assets.st-note.com/img/1702434279571-qfXxi6bzvt.png)
ももろみ様(@tmh_red)
![](https://assets.st-note.com/img/1702335481819-ioOpBijHm7.png?width=1200)
![](https://assets.st-note.com/img/1702335502337-r4VdHgnYBt.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702335540775-lbhIhAmrj0.png)
![](https://assets.st-note.com/img/1702335554840-HerRyXoO48.png)
![](https://assets.st-note.com/img/1702335563722-5w77ad1HAs.png)
わ、わからん・・・!元々絵が美麗な人の絵は作業者たる私の見る目がなく判断がつきかねます。
ちのミ(@chinomi_R)様
![](https://assets.st-note.com/img/1702335736938-PO98L1W5rS.png?width=1200)
![](https://assets.st-note.com/img/1702335748389-VvQMZfsVFd.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702340709057-EnpDnJPgeW.png)
![](https://assets.st-note.com/img/1702340721006-A5ZbPr8Z0c.png)
![](https://assets.st-note.com/img/1702340728038-uMm9iUd4eT.png)
おめめとか少しだけ雰囲気でているかも、わからん・・・!!
ケロリビドー(@keroribido)様
![](https://assets.st-note.com/img/1702342185345-6n8xRvSwI5.png?width=1200)
![](https://assets.st-note.com/img/1702342192189-Xj6xvyM3gJ.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702357907590-H91WmCf62C.png)
![](https://assets.st-note.com/img/1702357909770-gaGgzkmqKj.png)
![](https://assets.st-note.com/img/1702357913594-eKPz8bGpEb.png)
目の感じとかそこそこ似たかもしれない・・・!線の感じもでていますね。
青猫(@aoneko)様
![](https://assets.st-note.com/img/1702356357148-YZN4Ey7zOR.png?width=1200)
![](https://assets.st-note.com/img/1702356362892-FWcW5m3Um4.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702356384929-mJUl07Cibg.png)
![](https://assets.st-note.com/img/1702356390027-XQYuRI6nw0.png)
![](https://assets.st-note.com/img/1702356396309-7bClkXpxpw.png)
う、うーーん、線の感じや塗は似ているかな?デフォルメ具合はあんまり似ていないかも
カンジと犬と日常(@saltcandycake)様
![](https://assets.st-note.com/img/1702374184116-b0AEWQC6xQ.png?width=1200)
![](https://assets.st-note.com/img/1702374190718-1SnxKDwJvM.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702374217719-dR9SOJznGT.png)
![](https://assets.st-note.com/img/1702374224586-rHGYCeMQIU.png)
![](https://assets.st-note.com/img/1702374230314-xn4de0yKUV.png)
う、ううううん、わからない。私には絵柄が・・・!わからない・・・!!
加工を若干控えめにしたのが敗因な気がします。
星守 灯夜(@yoru_tomosu)様
![](https://assets.st-note.com/img/1702374670325-hEGy2YF7uh.png?width=1200)
![](https://assets.st-note.com/img/1702375559838-MxZ7OxhVi2.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702422321219-Jc5mcauQ8G.png)
![](https://assets.st-note.com/img/1702422323479-3GVtrj98r7.png)
![](https://assets.st-note.com/img/1702422327059-uDE2nKeQuq.png)
あ、元のイラストの魅力的な色使いが若干現れている気がします!
AIに修正させながら『ここは覚えてほしい~!』と思った箇所なのでうれしい!!
櫛魚誠(@fluffplump)様
![](https://assets.st-note.com/img/1702422668542-Z0VP5wSSW9.png?width=1200)
![](https://assets.st-note.com/img/1702423273572-F3OgEcsvzo.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702434001126-puVtmn6Z5K.png)
![](https://assets.st-note.com/img/1702434014261-0DJphlEzAj.png)
![](https://assets.st-note.com/img/1702434387258-6fvdK8sS5V.png)
SDHK04(ベースモデル)と比較すると塗りが影響を少し受けているかも・・・? 目の形も頑張ろうとした形跡があるけどきっちり覚えてはくれなかった模様。
つきぎりんけつ(@tukigiri)様
![](https://assets.st-note.com/img/1702425416269-l4hAi3s8wi.png?width=1200)
![](https://assets.st-note.com/img/1702425445894-mxhrUwdfzL.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702438735097-Tk0GFGVvde.png)
![](https://assets.st-note.com/img/1702438746212-uV0hKiefg4.png)
![](https://assets.st-note.com/img/1702438753041-wVGZyc1BVX.png)
こう解釈くるかー。つきぎりんけつさんの絵柄とは別物だけど1枚目の絵柄かなりすき。
ちゅんちゅん亭すがさ(@LuvTeaLatin)様
![](https://assets.st-note.com/img/1702425829101-06u0Nr7fZf.png?width=1200)
![](https://assets.st-note.com/img/1702425897386-qAnzPkrdYG.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702443634641-Xr2TcMa5ZC.png)
![](https://assets.st-note.com/img/1702443652421-uM0cgiteiy.png)
![](https://assets.st-note.com/img/1702443660950-nooULympno.png)
お目目の感じがでている気がする? 塗はベースモデルの感じがでちゃった感じあります。
紅茶うさぎ(@teausagi_trpg)様
![](https://assets.st-note.com/img/1702426596487-zfxS8ama0b.png?width=1200)
![](https://assets.st-note.com/img/1702426618101-TgLO9D1ELo.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702451123728-XXg47FFw1Y.png)
![](https://assets.st-note.com/img/1702451129652-0DnQpm1wcH.png)
![](https://assets.st-note.com/img/1702451135496-Hx1UM1rWSj.png)
2枚目の男の子の目の形は若干影響を受けている気がします。
わら(@wara_hirono)様
![](https://assets.st-note.com/img/1702426761166-m2TI4k2ySy.png?width=1200)
![](https://assets.st-note.com/img/1702427467365-PTergPAZti.png?width=1200)
以下AI生成結果。
![](https://assets.st-note.com/img/1702455404436-2gTXa4DLYk.png)
![](https://assets.st-note.com/img/1702455412815-KKQorAhQnF.png)
![](https://assets.st-note.com/img/1702455421344-X79lI3cQ92.png)
ふわっとした塗とキャラデザの前髪の影響受けている・・・?
感想
絵を見て判断する力がないので、上手く差分を作れねぇ!作れたLoRAを評価する軸を持ってねぇ!
という苦しみを味わいました。これ絶対絵が描ける人が差分作った方が良い結果でると思います。
簡単レシピ
繰り返しになりますが、許諾なく特定個人の絵柄を加工したり学習することは無用なトラブルの元です。再現実験する場合は自分の絵で行うか、必ず許諾を得てから行ってください。
以下は上記のLoRA群を作るのに作った環境メモです(月須和さんPDFのように細かい微調整はしていません)
RTX3090で1セット(加工イラストと元イラスト)学習させるのに大体1時間かかります。
git clone -b sdxl https://github.com/kohya-ss/sd-scripts.git
cd sd-scripts
python -m venv venv
.\venv\Scripts\activate
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
pip install -U xformers
pip install --upgrade -r requirements.txt
python -m pip install bitsandbytes==0.41.1 --prefer-binary --extra-index-url=https://jllllll.github.io/bitsandbytes-windows-webui
accelerate config
- This machine
- No distributed training
- NO
- NO
- NO
- all
- fp16
フォルダ名は適当(繰り返し数は適当に10000とかでOK、step数指定なので)
1024,768,512にそれぞれリサイズして保存。キャプションは適当につけておく。
![](https://assets.st-note.com/img/1702428592855-2HirhiRxGV.png?width=1200)
copi-ki.toml(GPUによってtrain_batch_sizeは変えること)
pretrained_model_name_or_path = "C:/stable-diffusion-webui/models/Stable-diffusion/SDHK04.safetensors"
network_module = "networks.lora"
xformers = true
persistent_data_loader_workers = true
max_data_loader_n_workers = 12
enable_bucket = true
save_model_as = "safetensors"
lr_scheduler_num_cycles = 4
mixed_precision = "fp16"
learning_rate = 0.0001
resolution = "512,512"
train_batch_size = 12
network_dim = 128
network_alpha = 128
optimizer_type = "AdamW8bit"
bucket_no_upscale = true
clip_skip = 2
save_precision = "fp16"
lr_scheduler = "linear"
min_bucket_reso = 64
max_bucket_reso = 1024
caption_extension = ".txt"
seed = 42
network_train_unet_only = true
コマンド一覧
#baseの絵柄LORA学習
accelerate launch ^
--num_cpu_threads_per_process 12 ^
train_network.py ^
--config_file="C:\sd-scripts\user_config\style\copi-ki.toml" ^
--train_data_dir="C:\sd-scripts\user_config\style\base" ^
--output_dir="C:\sd-scripts\user_config\output\style" ^
--output_name=copi-ki-base ^
--max_train_steps 1500
#学習させたい絵柄LORA学習
accelerate launch ^
--num_cpu_threads_per_process 12 ^
train_network.py ^
--config_file="C:\sd-scripts\user_config\style\copi-ki.toml" ^
--train_data_dir="C:\sd-scripts\user_config\style\〇〇" ^
--output_dir="C:\sd-scripts\user_config\output\style" ^
--output_name=copi-ki-〇〇 ^
--max_train_steps 1500
#絵柄の差分抽出
python .\networks\merge_lora.py ^
--save_to "C:\sd-scripts\user_config\output\style\〇〇.safetensors" ^
--models "C:\sd-scripts\user_config\output\style\copi-ki-〇〇.safetensors" "C:\sd-scripts\user_config\output\style\copi-ki-base.safetensors" ^
--ratios 1.4 -1.4 ^
--concat ^
--shuffle ^
--save_precision fp16
#LoRAのリサイズ
python .\networks\svd_merge_lora.pyy ^
--save_to "C:\sd-scripts\user_config\output\style\〇〇_128.safetensors" ^
--models "C:\sd-scripts\user_config\output\style\〇〇.safetensors"
--ratios 1
--new_rank 128
--device cuda
--save_precision fp16