予定外に有償契約した KlingAIでしたが...。
「Black Friday Mega Sale 」での初回月値引きで衝動的に有償契約
してしまった KlingAI ですが、まあせいぜい無償利用では体験出来
なかったモードがどれだけ差を持つのか確かめて置こうと考えました。
具体的には無償利用でも使えた Kling 1.0 の Standard モード
(10 クレジット / 1 動画)に加えて、Professional モード(35 クレジット
/ 1 動画)、Kling 1.5 の Standard モード(20 クレジット / 1 動画)
に加えて、Professional モード(35 クレジット / 1 動画)が使える
ようになりました。
最近、メイン PC 側で静止画生成と CogStudio での動画生成を
行っていた題材では「扇情的かつ繋がりが無関係な 2 シーン化」
ばかりがどのモードでも出てしまって、公開に馴染みません。
まだ色気過剰が弱いもの(これでもかよ)を一例だけ…。
何だこりゃ。顔デカ。何国人? 心底呆れて評価する気が薄れます。
原画に原因があるのかもしれませんが…。
この原画自体もまた不可解なもので「in empty room 」でのプロンプト
の間は、下記の「bodysuit (((full-covered arms and legs)))+++」の通り、
プロンプトをどう調整しても赤い水着(四肢とデコルテが全露出)でした。
「in spaceship room」に替えた途端、ほぼ 100%、nano-suits 装甲
の下の高機能アンダーウエアでのオフタイム描写だと理解して貰えた
のか、顔から下は意図通りフルカバーとなりました。
ご参考というか、不可解のご検証用にプロンプトを置いておきます。
「in empty room 」との差をご確認ください。
(ある種の意味で「magic Prompt」です。)
medium shot, (night outside) , ((wearing a red bodysuit (((full-covered arms and legs)))+++ )), in bright spaceship room, smiles, (very short bob cut hair), wide hip, large breasts, perfect slender young girl body, perfectly glossy skin ,25 yo mature girl, picture of a vivid, masterpiece, perfect lighting, asian beauty, <lora:AsirAsianPhotographyflux:1.4>
CheckPoint F1 ファイルは flux1-dev-bnb-nf4-v2.safetensors です。
話はさらに脇にそれますが、先日の事故からの CogStudio 環境再構築で
最新のバージョンに入れ替えるしかなかった経緯以後、この原画など
人物画からの動画が HailuoAI のように「やたら汚く喋ろうとする」のも
とても気になっています。
が、既に執筆完了して公開待ちの CogStudio 設定チューニングに関する
記事を一旦公開の後で、他題材を含めて詳しく検討するつもりです。
(今の記事公開待ち順列からは、年明け以降となります。)
そのような経緯から、今回は致し方なくチェックにはハードルが低い
メカ画で各モードを検証します。
リクエストを投入しましたら、ただちに「5 分後には完了」と出ます。
しかし時々ながら 1 分前からずっと沈黙になるのは、やはり有償契約後
も変わりません。これには正直失望を禁じ得ません。
HailuoAI や Runway はそのようなことがありませんでした。
Kling 1.0 の Standard モード(10 クレジット / 1 動画)です。
以前から時折気になっていた通り、詳細の描写がやや甘いです。
(GIF化による画質劣化は若干あります。以下同様。)
プロンプトに「rotating space station」は加えましたが回転しません。
ロゴはありません。ただわざわざ「Download without Watermark」を
選んでダウンロード要です。
過去の動画を今の有償契約下のロゴなし状態で入手しておこうと
して 420 動画、その手順はもう大変でした。HailuoAI には一括で
ダウンロード(Zip 形式)がありました。Runway は新規 25 動画
と過去の自作曲のための僅かな動画数だったので、問題はありません
でした。
KlingAI 1.0 の Professional モード(35 クレジット/ 1 動画)です。
回りました。細部も幾分しっかりと見えます。
Kling 1.5 の Standard モード(20 クレジット / 1 動画)です。
細部はしっかり出ていますが、墜ちて行ってしまいました。
内部のスポーク構造も不安定です。
Kling 1.5 の Professional モード(35 クレジット / 1 動画)です。
Kling 1.0 の Professional モード(35 クレジット / 1 動画)と逆回り
なので影の部分への光の当たり方の単純比較は難しいですが、
大した差には感じません。
GIF 化前の MP4 での比較でも、無償利用時代から時折気になっていた、
Kling 1.0 の Standard モード(10 クレジット / 1 動画)での細部の甘さ
がやはりあって、それ以外の 3 モードはそれほどの差は無い印象です。
ちなみに、原画サイズ 1152 × 896 pixels に対して、
Kling 1.0 の Standard モード(10 クレジット / 1 動画)は容量 4.5 MB、
動画サイズ 1152 × 896 pixels、 30fps、総ビットレート(=データ速度
も同じ値)が 7758 kbps でした。
Kling 1.0 の Professional モード(35 クレジット/ 1 動画)は
容量 8.4 MB、動画サイズ 1088 × 832 pixels、 30fps、総ビットレート
(=データ速度も同じ値)が 14106 kbps でした。
Kling 1.5 の Standard モード(20 クレジット / 1 動画)は
容量 5.3 MB、動画サイズ 1088 × 832 pixels、 30fps、総ビットレート
(=データ速度も同じ値)が 8924 kbps でした。
Kling 1.5 の Professional モード(35 クレジット/ 1 動画)は
容量 8.3 MB、動画サイズ 1632 × 1248 pixels、 30fps、総ビットレート
(=データ速度も同じ値)が 13970 kbps でした。
これらのことからも、MP4 での比較の印象通り、
Kling 1.0 の Standard モード(10 クレジット / 1 動画)だけがやや
小さく粗いデータであり、他の 3 モードは比較的近接した仕上がり、
なおかつ Kling 1.5 の Professional モード が最も大きな動画サイズ
を提供しているということになります。
Runway Gen-3 Alpha Turbo と Kling 1.5 の Professional モードの
画質対決には興味があるものの、この宇宙ステーション原画からの
Runway Gen-3 Alpha Turbo の動画がありません。迂闊でした。
他にはお試し時期のロゴ付きならありましたが….。
ちなみにこれが原画です。Runway は原画よりも微細な描き足しがある
ような印象の一方、陰影や階調がやや平板で、恐らくシャープネス処理
をやや過剰に為されているものと推察出来ます。
この原画で Kling 1.5 の Professional モード で動画生成してみました。
要らぬことを…。これでは比較になりません。
再度実行しました。
なぜ上掲の宇宙ステーション画ではプロンプトや意図に従順だった
(勝手に墜ちたのもあったが)のに、この暴れ馬状態は何でしょう。
動画変化量も落ち着かせる方向で設定しています。
プロンプトに「rotating space station」は加えて、U.F.O. など別の
物体への誤解釈も防止しては居ます。
再度実行しました。
くどいですが、再度実行しました。最後の見極めです。
まるで比較をさせないかのようなフェイントの動きばかりですが、
まあそれが一つの結論に直結します。
「要らぬ演出ばかりで、プロンプトや意図に沿う動画をなかなか
生成しない」という無償時代からの印象は、Kling 1.5 になっても
改善されていないということです。
Runway Gen-3 Alpha Turbo の圧勝です。
VideoPloc Vlogger を使って画質とシャープネスに下駄履きをさせる
意欲も失せました。(それでほぼ同格の動画を得られるなら、Runway
が無駄に高価なのだ、と結論付ける方向も当初考えていたのでした。)
有償使用 1 日目にして、もう当月中でのサブスクキャンセルで良いかと
考えます。
動画を生成する、という機能自体は悪くないのでした。
しかし「意図に沿った動画を生成させるツール」としては「人物が
下品に喋り過ぎる HailuoAI 」と同様に使えない、ということです。
KlingAI は無償利用かつ VideoPloc Vlogger を使ってロゴをクロップ
排除と同時に画質とシャープネスに下駄履きで充分でしょう。
高画質の 3 モードは使えませんが、そもそもそこまで画質が気になる
ほどの意図通りの動画がどれだけの確率で生成するのか、という次元
に思えます。無償で無制限に使える CogStudio や人物以外の用途で
同様にロゴを排除させて使える HailuoAI をたまに補完出来れば
充分です。
(同日追記)
そうは言いつつも、実はその後も何度かリトライしてようやく
ほぼ落ち着かせました。
プロンプトの「rotating space station」をむしろ削除して、
「プロンプトと干渉するので設定を勧めない」とアラートが出ていた
動画変更量を抑止方向に最大値まで上げて動画生成させました。
(アラートはまだ出ていますが、プロンプトが無いので干渉も
あったものではありません。)
VideoPloc Vlogger を使って画質とシャープネス(最大の 500 % 強調)
まで下駄履きさせてみました。(悪あがき)
GIF 化したものではあまり差は見えませんが、元の MP4 では見かけの
質感は上がりました。しかし….。
MP4 も置いておきます。
(500 % 強調ではややザラっとしたアラが背景に見えるので 320 % 強調
のもの)
動画の質は Runway Gen-3 Alpha Turbo が圧勝、補正しての下駄履きで
届く差ではない、成功例を引き出すのに何リクエストも試行錯誤が必要、
という結論は動きませんでした。
勝負あった、とは言えますが、コストと実用価値という観点ではどう
なのか、Runway が正義(?)なのかというところに議論の余地は
残るかとは感じます。それは上掲の MP4 でご判断ください。
(おい。結論棚上げかよ….^^;; いえいえここは各クリエータ氏のご判断
によるところが大きく、当方が断定的に結論付ける領域ではありません。
当方はそのご判断材料を提示したに過ぎません。)
Pyramid Flow 導入を一旦断念からの予定外の時系列割り込み記事は
ここで一旦終了です。
執筆して公開予約待ちの大量の記事を順次年明けまで公開して行きます。
(本記事の割り込みにより、公開予定待ちの記事の公開順は 2024/12/31
(火)まで埋まりました。)
その裏で当方は自身がやるべきことを先日の時間割に沿って推進します。
大黒柱として家計を支える 39 年の就業人生(自身の人生を切り売りして
対価を得るために、理解不能かつ不本意な作業に人生を延々浪費する)から
解放された後は、他の同年輩同様にもっと余生を達観かつ享楽 / 快楽的
に気侭に謳歌しなよ、とも自身で思うのですが、先の記事で記した、
> 呪わしくも、そのように生まれ付いた人間なのでした。
が、もって生まれた当方の人生の主軸であることを自身ではどうにも
出来ないのでした。
心底、現在の住居四方近隣の「死ぬほど暇やからベランダでタバコ
でも吸お」オヤジとか、過剰就労の昔に昼飯のゆとりもなく販売会社
打合せへの移動中、街中で歩く手前で偶然 14 時あたりに何度も遭遇した
「さっき起きたところやけど暇やしカラオケでも行こ。お腹も減って
るし~。(= 反日左翼のロビー活動で OECD のカウントでは「先進国
では前例もないほどの酷い女性差別と蹂躙のために働きたくても働けない、
救うべき哀れな日本人女性」にまんまと数えられている)」20 代女の
人生に「代わってくれ!それかお前の余生、全部オレにくれ!」と
本気で言いたい自身が居ます。
ご覧いただきありがとうございます。
(2024/11/23 執筆)