![見出し画像](https://assets.st-note.com/production/uploads/images/155735343/rectangle_large_type_2_da447e7fa84bef53f18bed1ea2072c4f.png?width=1200)
Cog Studio を含めた新 3 者比較をする予定でしたが辞めました。もう Cog Studio だけで充分です。
この記事に続く動きとして、Leonardo.Ai の代わりに Cog Studio と
KlingAI と LUMA AI の DreamMACHINE の 3 者比較記事執筆を目指して、
動画生成をそれぞれにさせていましたが、もう根負けというか断念
をしました。
もう Cog Studio だけで充分です。
Cog Studio は動画生成処理開始時点で、終了までにかかる時間が
分かります。これは他からの大量リクエストで待ち行列幅が変化する
KlingAI や LUMA AI のDreamMACHINE などのクラウド系動画生成
サービスでは望めません。(Cog Studio 起動直後の動画化ではこの
表示はありませんが、次の画を動画生成させるために refresh ボタン
を押して次の動画生成に入ると、この表示が出ます。初回の動画化
から類推するのでしょうかね。)
![](https://assets.st-note.com/img/1727333948-BgPYdy78EAO5IJtkMfsZq1XK.jpg?width=1200)
![](https://assets.st-note.com/img/1727333960-GBnRe8STrfW25aUgbFONPz7x.jpg)
Cog Studio が2000 秒(33 分)弱で確実に動画生成出来る一方、
KlingAI は、もう今はほとんど結果が戻って来ません。
何日か待ってエラー終了でお詫びのクレジット戻りが積み上がる
ばかりです。
![](https://assets.st-note.com/img/1727332839-mha2jO6pzeub9AQPVtFDCWrK.jpg?width=1200)
LUMA AI の DreamMACHINE は 一時期よりは無償ユーザ虐めの
「IN QUEWE」待ちが緩和されて、2 時間から半日で戻って来る
ものの、折角の FLUX.1 での美しく緻密なサイバー女子隊員画が
動画化で恐ろしい形相に変わって行くのを見るにつけ、もう
Cog Studio + Dain-APP だけに集中して KlingAI と LUMA AI の
DreamMACHINE も、もう要らないんじゃないか、という心境に
至りました。
![](https://assets.st-note.com/production/uploads/images/155720270/picture_pc_6f238821f5e96e8b179d52d9d998a97c.gif)
![](https://assets.st-note.com/production/uploads/images/155720536/picture_pc_93a3ce0e8acfdbd9cec4e487af082eb4.gif)
まあ KlingAI と LUMA AI の DreamMACHINE にも動画生成リクエスト
は投げておくものの、Cog Studio との 3 者の成果が揃うまで比較の
機会を待つのはやめて、それぞれ非同期に面白い結果が出たら記事に
する、動画化はもう「地味だが確実」の Cog Studio + Dain-APP で
充分だ、と以降は考えることにしました。
以下は予定していた動画比較のために FLUX.1 で描画させた原画
から Cog Studio で動画生成したものです。
中には Dain-APP でフレーム補完させたほうが良いものもあり
ますが、Cog Studio の能力を提示する目的で、今回はいずれも
未処理状態での公開です。(そもそも先日の記事の通り、note
記事に貼り付けるために GIF 化した状態では、あまり差が分かり
ません。)
動画生成時にプロンプトを与えないと、Cog Studio の動画生成AI に
「何も言わないが原画から描かれた対象の識別と、人間側の意図を
把握してうまく動かせ」と言っているようなもので、全く動かない
動画が生成される場合も当然ありました。
画像だけの情報で動画生成AI が知識ベースと照合するより、補足の
文字情報があるほうが照合は容易となる訳です。
なので与えるプロンプトは原画生成時の複雑なものでなくとも、
原画を見て人間が言葉で簡単に補足するレベルで良いと考えます。
動画生成時に「rotating space station」を添えました。
添える前は回りませんでした。
![](https://assets.st-note.com/production/uploads/images/155723741/picture_pc_9df9d88b0bf1ccb84d73435a09e6d8e8.gif)
同じく動画生成時に「rotating space station」を添えました。
![](https://assets.st-note.com/production/uploads/images/155723896/picture_pc_f60a1afd97dd7d7a94c4f57bad5f75dc.gif)
動画生成時に「volcano explosion」を添えました。
激しすぎて長秒化(半速化)したほうが良さそうです。
![](https://assets.st-note.com/production/uploads/images/155724425/picture_pc_e06f47f7718ea008bbc4e2ef2cfdb8b0.gif)
動画生成時に「cloud sea and black hole」を添えました。
(科学的にどうなのか?という妙なこだわりより直観感覚で手短かに
伝えることが重要です。)
![](https://assets.st-note.com/production/uploads/images/155724684/picture_pc_f03e808f8c16696c05e74197a80c14a0.gif)
動画生成時に「Landscape walking on another planet」を添えました。
「walking」が余計だったかなとも今は思います。
![](https://assets.st-note.com/production/uploads/images/155724855/picture_pc_465338a2b468916633441661cf832adc.gif)
動画生成時に「Landscape on another planet」を添えました。
![](https://assets.st-note.com/production/uploads/images/155725035/picture_pc_f63a5e5c5e09886c13adb9a5499c9f50.gif)
同じく動画生成時に「Landscape on another planet」を添えましたら
全く動かない動画が出ましたので、さらに「Swirling light」(渦巻く光)
を追加しました。渦巻いてませんが少し動きは出ました。
![](https://assets.st-note.com/production/uploads/images/155725466/picture_pc_3dbe812fb61f2e0997b1de5879ca650e.gif)
同じく動画生成時に「Landscape on another planet, Swirling light」を
添えました。
![](https://assets.st-note.com/production/uploads/images/155725769/picture_pc_fd537c62ec68de2cfca2d4971e4f0028.gif)
上掲の LUMA AI の DreamMACHINE の 2 動画めと同じ原画による
ものです。「最低限の動きの肖像動画で必要充分」が意図ですので、
プロンプトをあえて与えていません。
そして原画(この note 記事のタイトル画)のノーブルな雰囲気が
充分に活きた、意図通りの動画になりました。
![](https://assets.st-note.com/production/uploads/images/155726265/picture_pc_70be7386d452906bb8709d80bbe11d69.gif)
表情と上半身の筋肉の連動など、解剖学的な知見も正しく踏まえた
動画生成になっています。
FLUX.1 描画によるリアル感も最大限活きています。
そうです。リアルな FLUX.1 による人物画に「命を吹き込む」ことが、
ここでの動画化の目的なのでした。余計なアクションや演出は不要
という訳です。
本来そうある筈なのでした。原画が SD1.5 から飛躍的に写実感を
向上させたのに、LUMA AI の DreamMACHINE のようにそれを丸めて
しまって実感出来ない動画化というものが、果たしてこれからも
使う価値があるのか、という疑問が大きくなって見切りを考えた、
ということも否めません。
これらも全てプロンプトなしです。
![](https://assets.st-note.com/production/uploads/images/155848031/picture_pc_9ed27d478ed71a6c347c4b41c3c84dc3.gif)
![](https://assets.st-note.com/production/uploads/images/155850478/picture_pc_80665e54ba84eb9bdba8fa022c6696cb.gif)
![](https://assets.st-note.com/production/uploads/images/156132480/picture_pc_97ebf4658bac9f706f49a5f2840b8db7.gif)
![](https://assets.st-note.com/production/uploads/images/156132560/picture_pc_32bf6d6c6e1d604d7b8d74c24e4b24c4.gif)
![](https://assets.st-note.com/production/uploads/images/156132676/picture_pc_03fdccc14a04ec230a207e236d72c616.gif)
後ろのサイバー男子隊員の動きが余計….(^^)。
![](https://assets.st-note.com/production/uploads/images/156132821/picture_pc_fefff811971c38b9af0ac892cb08015f.gif)
![](https://assets.st-note.com/production/uploads/images/155730926/picture_pc_7284e4af22fa37a540235842df07acd9.gif)
![](https://assets.st-note.com/production/uploads/images/155854354/picture_pc_94b0fbf940f98bfcbcf1df057498e181.gif)
![](https://assets.st-note.com/production/uploads/images/155747198/picture_pc_cf2387bfe30688fdf4906de3ca54a72b.gif)
![](https://assets.st-note.com/production/uploads/images/156005833/picture_pc_a71cb5a8e4c09cb355494301a1224cd9.gif)
ほとんど動きませんが、本記事末尾をご参照ください。
![](https://assets.st-note.com/production/uploads/images/156005889/picture_pc_3c7a169d54938244adc5d9289a19ffd7.gif)
![](https://assets.st-note.com/production/uploads/images/156005983/picture_pc_7f47fe9582172f73d280c4b429718b83.gif)
![](https://assets.st-note.com/production/uploads/images/155766237/picture_pc_76273c423fb97074a7237fcc22cd0849.gif)
![](https://assets.st-note.com/production/uploads/images/156006077/picture_pc_d4bcd760e6ba94d37440577d3c937c95.gif)
この原画からの動画化は、全く静止したまま動かないものが出力された
ので、プロンプト(「Strength」= 0.8)に「Smiling, she senses
something unusual around her and gets ready to fight.(微笑む彼女は
周囲の異変を察知して戦う態勢になる)」を添えて再処理させましたら
こんな動きが出ました。「異変を察知して戦う態勢」というより何か
虫でも飛んで来て慌てた感じですか…。上げた腕の質感が手編みセーター
みたいで少し変です。でもとにかく動きを与えることは出来ました。
![](https://assets.st-note.com/production/uploads/images/156005645/picture_pc_098fd47febabd5066bec25be960d0dd1.gif)
遥か未来の異星開拓現場に居る彼女と時空を超えて、この画像を
通して相対しているかのような(スクリーンでアイコンタクトを
しているレベルで)感情が沸き起こるほどの「リアル」がここに
あります。(おいおい大丈夫かよ耄碌ジジイ)
![](https://assets.st-note.com/production/uploads/images/155766383/picture_pc_0e58e0afee68f05a4caf8aa66acabc18.gif)
この口角が上がって頬骨の前の筋肉が前に出る表情筋の動きも
解剖学的知見を踏まえた正しい動画化です。
![](https://assets.st-note.com/production/uploads/images/155747321/picture_pc_83eb49d86a22e511538fcac0e008477f.gif)
しかしサイバー女子隊員動画に関しては、時折異様な「やらかし」も
発生しました。「Strength」項の値は大きいと変化量が大きくなるのか
その逆なのかも、今はよく分かっていませんが、「やらかし」が発生
した際には、その値を「0.8」から「0.6」に動かしたりすると解消する
ようで当面はそれで乗り切る一方で、メカ画や宇宙画ではそれが全く
発生しないのも逆に不可解です。
「Strength」=「0.6」での動画です。
後半にワンシーンが挿入されます。GIF はリピート再生するので途中に
シーンが挿入されたように見えます。回想シーンにしても異様です。
![](https://assets.st-note.com/production/uploads/images/155731623/picture_pc_976ead189d410d8204c7e9c3a89f2fa7.gif)
「Strength」=「0.8」での動画です。
![](https://assets.st-note.com/production/uploads/images/155731793/picture_pc_fe83251f906fa5793a1c5cd6ce05192a.gif)
逆にこちらは「Strength」=「0.8」での動画です。
動画生成 AI の中でどのような物語が想起されたのでしょう…(@_@;;)。
![](https://assets.st-note.com/production/uploads/images/155734743/picture_pc_33c58a38478642ae4ab1c68b5f3ecbf2.gif)
「Strength」=「0.6」で落ち着きました。逆に怖いかも…。
![](https://assets.st-note.com/production/uploads/images/155734804/picture_pc_52e89e4cec52e0099861ca0636f64289.gif)
上掲の動画の中でほとんど動かなかったものがありましたが、実は苦労
して何度も動画生成させて、ようやく 6 秒やらかし無しの動画を生成
させたものでした。いずれもプロンプト無しでしたが、やらかしが
発生するのは、発生しないものと何が異なるのでしょうか…。
2 例ほど併載しておきます。
![](https://assets.st-note.com/production/uploads/images/156096166/picture_pc_e10282fc65c7ae717dc69b5c918d6471.gif)
![](https://assets.st-note.com/production/uploads/images/156096233/picture_pc_63a4c78746080ee4126a72c2f52deb38.gif)
正味のところ、KlingAI や LUMA AI のDreamMACHINE のやらかしまで
気にしているゆとりも無いです。
Cog Studio を手なづけるだけで今はもう手一杯です(^^)。
ご覧いただきありがとうございます。
(2024/09/26 執筆)