
巷で語られるほど CogStudioはダメか? CogStudio+DainAPP、pyramidflow-miniflux、 KlingAI での 3 者比較。(2 / 完)
続きです。直前記事で傾向を把握できたところで、記事への貼り込み容量
の制限があるらしく、以降はMP4 は記事に貼らず Adobe Express での GIF 化
での比較に留めます。
原画です。

CogStudio + DainAPP です。おお。意外に頑張る….。

pyramidflow です。背景は明らかに手抜き。

KlingAI です。比べるほどに一切の妥協感無し。

原画です。

CogStudio + DainAPP です。最後まで原画のニュアンスを維持します。

pyramidflow です。背景はただちに手抜きに入ります。

KlingAI です。やはりひと演出加えますね。悪くないです。

原画です。

CogStudio + DainAPP です。原画のニュアンスを一貫して維持します。

pyramidflow です。背景がただちに手抜きに入ります。

KlingAI です。画角変化につれて少し顔の変化が不自然でしょうか。

原画です。

CogStudio + DainAPP です。原画の意図通りです。

pyramidflow です。うわ。変顔…。

KlingAI です。同様にひと演出が加わります。

原画です。

CogStudio + DainAPP です。
意外な回り込みも手抜きや破綻は無い感じです。

pyramidflow です。酷い手抜きです。

KlingAI です。原画のニュアンスが最も維持されています。

原画です。

CogStudio + DainAPP です。
なんだか不服そうな口の動きです。「え?そんなの聞いてない!」って
感じの何だか愛らしいですね。珍しいです。

pyramidflow です。簡略化してしまえばコマ補完もラクではありま
しょうが…。

KlingAI です。光源の強弱が顔に反映するのも見事です。

原画です。

CogStudio + DainAPP です。何かを追う眼の動きがとても自然です。

pyramidflow です。眼の動きが酷く不自然です。

KlingAI です。生命感が伝わって来る動きです。

原画です。

CogStudio + DainAPP です。原画からの期待に沿う仕上がりです。

pyramidflow です。うわ。瞬きが不気味…。爬虫類か。

KlingAI です。胸元にも装甲があってほしい…。
スパークも飛ぶ設定の中で要らぬ「サービス」です。

原画です。

CogStudio + DainAPP です。原画のニュアンスを一貫して維持します。

pyramidflow です。あまりに酷い手抜きです。
覆っていたものが急速に消長する、という表現もアリでしょうが、
毎回そればかりもどうか。コマ補完して動画生成するのがそれほど
面倒(中に人が居る?^^)なのか、という不審さえあります。

KlingAI です。うお。ダイナミック。流石の描写です。
周囲の流体との連動も見事です。

原画です。

CogStudio + DainAPP です。原画のニュアンスが最後まで活かされて
います。

pyramidflow です。これも手抜き感満載です。

KlingAI です。流石の表現力です。

原画です。

CogStudio + DainAPP です。地味ながら原画からの期待通りです。

pyramidflow です。動画化に意味を為さない内容です。

KlingAI です。光源の当たり具合による顔の明暗の変化が見事です。

原画です。

CogStudio + DainAPP です。原画からの期待通りです。

pyramidflow です。これは手抜きが酷過ぎ。ハードウエア計器まで光芒と
同じように拡散してしまえばあとはコマを量産するのはラクってか…。

KlingAI です。計器に触れます。構図移動もシンクロして見事です。

原画です。

CogStudio + DainAPP です。原画からの期待通りです。

pyramidflow です。これも背景を早く拡散させて後のコマ補完をラクに
しよう、といった印象です。

KlingAI は一連の動画化で両手を掲げるのが多かったです。

pyramidflow-miniflux を RTX4060(GPU VRAM 8GB)の自機で動かせ
なかった長い間、ネット記事で「CogStudio ではお話しにならない」との
内容を見て、借金して GPU VRAM 16GB や 24GB の上位機種を入手しなくて
本当によかったです。今ではこのように両者の長所短所、原画に対する
向き不向きを自機で確認できるようになったからです。
今回は pyramidflow-miniflux に不向きな題材だったのかもしれません。
他の題材ではまた優劣は異なるかもしれませんが、
「CogStudio ではお話しにならない」は真逆の印象で、
pyramidflow-miniflux のアラばかりが目立ちました。
「pyramidflow は KlingAI のスタッフ参画での開発で KlingAI
水準の動画をローカル生成出来る」という期待は大いに外れました。
KlingAI どころか CogStudio + DainAPP にも及びません。
384p 版の pyramidflow-miniflux を使っているからだ、768p 版はこんな
ものじゃない(比較が不当)というご指摘もあるかもしれませんが
あくまで RTX4060(GPU VRAM 8GB)の自環境下で、より良く使える
ツールは何か? 巷で語られるほど pyramidflow-miniflux が CogStudio
を一瞥に見下ろすほどの差が本当にあるのか?という検証に留まります。
動かせないツールの優劣を評価に含めること自体がおかしいことで、
CogStudio も以前は単体で 16 fps 出力や大画面出力のオプションも
ありました。
DainAPP を使えば、自環境でも CogStudio で 768p 版相当の fps と
サイズの動画は生成出来ます。
この記事は pyramidflow-miniflux(384p 版)を堕とす趣旨で書いては
いません。表現の自由に完全解放されたローカル描画ツールとして
CogStudio に続いて pyramidflow-miniflux(384p 版)が登場したこと
自体はフル歓迎モードで受け止め、その表現差をプラス方向に活かし
つつ、これからの第 3、第 4 の動きに大いに期待しています。
一方、Kling1.6 にエンハンスされた KlingAI は「地味ながら確実」の
他の 2 者とは異なり、何投かしないと目的に沿った結果を得られない
暴れ馬な身勝手さが消えないものの、表現には破綻はなくダイナミックさ
と滑らかさ、縦横構図への自動対応もあって、有償契約当初より、むしろ
今の方が価値を感じています。「あると安心」そのものです。
クラウド系サービスの利点を生かして、メイン描画 PC での Stable
Diffusion Web UI Forge での FLUX.1 描画や CogStudio 動画生成、
pyramidflow 動画生成と同時並行に使えて、毎朝当日のみ有効付与の
3 動画 / 日の範囲で動画生成させるなら、月当たり付与の 660
クレジットが一向に減らない、というのも魅力です。
(しかも月次更新時に繰り越し可能)
今回の比較で大きく実感したのは、CogStudio の処理時間が長い
(HDD 環境では 2200 秒弱 / 1 動画。SSD 環境より 1 割増し)ことには
意味がある、ということと、Kling1.6 の凄さとローコストぶりでした。
また CogStudio 動画の左右の黒枠は、単に FLUX.1 on Stable Diffusion
Web UI Forge での生成原画と縦横比が合わないだけのことで、
CogStudio 動画の 720 × 480 pixels(固定)に縦横比を揃えると
解消します。
FLUX.1 ディフォルト設定の 1152 × 896 pixels を、1152 × 768 pixels
または 1344 × 896 pixels 指定に変えることで解消出来ます。
(いずれはその処置をしてから動画生成したものを掲載するように
します。現時点では沢山の記事が公開待ちしているので当面先のこと
になりますが。)
ご覧いただきありがとうございます。
(2025/01/06 執筆)