幻想的な動画をStableDiffusionでReactorを使って知り合いをモデルに
Civitaiのプロンプトを使ってAnimteDiffで動画を作ろと思ったら、GoogleColaboもPaperspaceもエラーになって動画を作れませんでした。画像は問題ないです。
しかしPCでは動作しました。
Civitaiにあるモデルに使っていたプロンプト
1girl, dancing, official art, unity 8k wallpaper, ultra detailed, beautiful and aesthetic, masterpiece, best quality, (zentangle, mandala, tangle, entangle), (fractal art:1.3) , extremely detailed, dynamic angle, cowboyshot, the most beautiful form of chaos, elegant, a brutalist designed, vivid colours, romanticism, by james jean, roby dwi antono, ross tran, francis bacon, michal mraz, adrian ghenie, petra cortright, gerhard richter, takato yamamoto, ashley wood, atmospheric, ecstasy of musical notes, streaming musical notes visible, girl is model,
best quality, masterpiece, absurdres, high quality, highres
プロンプトが長いとだめなのかもしれません。
RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
下記に変更して動画を作成しました。意外と短い方が綺麗に作成できる気がします。PaperspaceはFreeのGPUが空いていないので有料のA4000を使いました。これだとT4 GPUのGoogleColaboより早いですね。
ちょっと暗い感じがするのと、露出が多いとが気になるので、monotone, Overexposureを追加しました。(知り合いの写真でtxt2imgでReActorを使っているので、露出が多いと自分が恥ずかしくなります)
1girl,((dancing)), wallpaper, Ross Tran, francis bacon, michal mraz, Adrian Ghenie, petra cortright, takato yamamoto, ashley wood, atmospheric, ecstasy of musical notes, streaming musical notes visible,aesthetic, masterpiece,(zentangle, mandala, tangle, entangle), skinny, vivid colour, fractal art
ネガティブプロンプト
(worst quality:2),(low quality:2),(normal quality:2),lowres,bad anatomy,nsfw, nude,nipple, monotone, Overexposure
txt2imgでモデルに向いている