見出し画像

video2video関連 動画データに対しての画風変換・生成まとめ

こんにちは、Hi君です。
こちらも少し古い情報にはなりますが、せっかく調べたので記事としてまとめてみました。お付き合いください。

Batch img2img


AUTOMATIC1111/stable-diffusion-webuiの拡張機能の一つであるBatch img2img。こちらは特定のディレクトリ内の画像群を入力し、画像生成を行うことができます。ただ画像群につき1つのpromptやcontrolnet設定・ガイド画像を適用出来ないことが大きな欠点の一つです。

img2depth


img2depth はmulti-subject-renderにも使われているMiDasを使った単眼深度推定です。ControlNetやT2IAdapterはdepth2imageもサポートしているので、複数の対象物画像→深度画像としてコラージュ→コラージュ深度画像をガイドに所望の画像を出力する等の処理フローが可能となります。
ガイド画像に関して、どのような形でコラージュを行うか(深度画像的な変換は必須か)については、まだまだ議論の余地がありそうです。(ただ、ガイド画像としてはポーズスケルトンよりも多情報で生成物の一定の安定性はもたせやすいかもしれません)
ポーズ的なガイドを使えない対象物を含むシーンでの画像生成等は、この方法だと有効性はありそうですが、深度画像の品質次第ではあります。
セグメンテーション or インスタンスマスクや描画レイヤー階層情報等でも同様の事は恐らく可能 + T2IAdapterは複数種類のガイド画像情報が使えました。(スケルトンポーズ + セグメンテーションマスク等)

画像生成AI「Stable Diffusion」を使って新しいインテリアデザインを作成しまくる試み

gif2gif


Animation with ControlNet, almost perfect!

ControlNET to Video - Stable Diffusion Automatic 1111 Tutorial

その他機能


ControlNetの画像入力を動画シーケンス的に行いたい場合

フリッカー除去系のTips


マルチフレーム画像生成の際はseedを固定するとうまくいくようです。

vid2vid実装?


以上です!
次回の記事もお楽しみに。

文:Hi君
協力:inaho株式会社

いいなと思ったら応援しよう!