見出し画像

pyramidflow 環境構築のその後。【RTX4060 GPU VRAM 8 GB 】(3 / 完)

その後も ComfyUI 下で pyramidflow-miniflux を動かしているのでしたが
ずっとモヤモヤ感が晴れません。

過去の原画に遡って、guidance_scale  と video_guidance_scale の値を
探りつつ、生成される動画をできるだけまともにしようと繰り返すも
うまく行くのが 1 割に満たない状態です。動かなかったり破綻したり
なかなか手に負えません。

破綻がなくとも、表情にどこか気味悪さがあります。
CogStudio や KlingAI で動画化させた時のような、自然さや愛らしさが
滲み出て来ません。

最近の原画からは、不均一な瞬きが目につきます。ネガティブ・プロンプト
で「不完全な瞬き」「瞬きを途中で止める」などの指示は追加しています。
これでもかなりましなものをピックアップしています。

最初の瞬間は複雑だった原画の周囲背景が一瞬で曖昧なものに変わる
現象も目立ち始めました。「まとわりつく光芒」のような曖昧な表現に
おいてそれらは顕著になります。

あれだけ待ち焦がれた pyramidflow 導入でしたが、使いこなすにつれて
「こんな筈ではなかった」「コレジャナイ」感がじわじわ起こって来る
のを否めません。(よくぞ大借金して pinokio 下で動かすためにハイエンド
機を導入しなかったものです。)

24 fps 動画は滑らかで美しいものの、原画が持つニュアンスが安易に
簡易化され過ぎてはいないか、という不審が、そもそもの動画生成処理
の方式にも大きく関わっているのではないかという疑いの心境です。

原画から動画生成への表現力の観点で、巷では「比較までもなくお話に
ならない」との酷評を受けている CogStudio や、同等水準の描画力と
言われた KlingAI と比較をしなければなりません。


ご覧いただきありがとうございます。



(2025/01/08 執筆)


いいなと思ったら応援しよう!

この記事が参加している募集