画像生成AIで最も優れているKLING v1.6 (※2025年1月現在) - OpenAI Soraと比較する/ Blog - 2025/01/10
第3世代の画像生成AIで最も優れているKLING v1.6 (※2025年1月現在)を検証
12月19日、第3世代の動画生成AIの中で最も評価の高かった「Runway Gen-3 Alpha」が、KLING の新バージョン1.6に追い抜かれてしまいました。
KLING v1.6は、あらゆる場面でRunwayやSoraより期待した結果を得られており、映像制作において使用頻度が高くなっています。
今日は、難易度の高いシーンの検証結果を掲載します。
宇宙服のヘルメットをとり、歩き出すシーン
以下の動画をご覧ください。
KLING v1.6の生成ビデオは、プロンプトのとおり、宇宙服の女性がヘルメットをとり、歩き始めます。
Soraはヘルメットが変形したり、体の一部なったり、ハルシネーションが目立ちます。Runwy Gen-3 Alphaも同様にうまく表現できません。
平均10回程度、生成していますが結果はほぼ同じです。
プロンプト:
テキストプロンプトだけでビデオ生成(Text to Video)
再生時間:48秒
前半はKLING v1.6、後半はOpenAI Sora
このシーンの場合は、KLING v1.6が最も優れていることがわかります。
ただ、宇宙服のデザインは1980年代のSFドラマのような懐かしさがあり、ビジュアルセンスは今ひとつ。
逆に、Soraは(プロンプトどおりに動いてくれませんが…)ビジュアルはとてもスタイリッシュ。
2人の刑事が犯人を追うシーンを生成
ピンクヘアーの女性と黒人男性の刑事が犯人を追って走っているシーンを生成してみました。
こちらもKLING v1.6が最も安定した映像を生成しています。Soraは、歩きや走りの途中でコマ飛びのように引っかかります。動画をご覧ください。明らかに違います。
テキストプロンプトだけでビデオ生成(Text to Video)
再生時間:22秒
前半はKLING v1.6、後半はOpenAI Sora
KLINGは、v1.6になって他の動画生成を一歩リードしています。
Runway Gen-3 Alphaは追い抜かれてしまいました。
問題は「クレジット」です。
KLINGは無制限のプランがありません。最上位のプランを契約しても、すぐにクレジットを消費しますので、追加購入することになってしまいます。
無制限のRunwayやSoraのような使い方をすると、毎月3〜5万円くらい支払うことに(もっとかかるかも…)。
個人的に期待したいこと。
無制限プランのあるRunwayやSoraの性能をKLING v1.6レベルに上げてほしい。あるいは、KLINGに無制限プランを追加してほしい。
映画ストーリーボード
映画(ショートムービー)「COLORS」の制作が進行中ですが、今日は「動くストーリーボード」をご紹介します。
以下の例は、サウンドデザインのプロセスで使うストーリーボードで「ラジオドラマ」に紙芝居が付加されたような形式で、ビジュアルイメージを確認したいときに作成します。
キャラクターの声はAI音声合成(VOICEPEAK)、音楽生成はSuno AIを使っています(以下のストーリーボードには音楽は入っていません)。
効果音だけはマーケットプレイス(Envato)から素材データを購入しています。効果音生成は品質が低いので使えませんでした。
シーン設定:
もっとラフに作る場合は、Adobe Fireflyを使います。
ほぼ紙芝居です。
動くストーリーボード(ラフ)
再生時間:55秒
プロトタイピングでは、手間をかけず素早く作ることが鉄則なので、紙芝居で十分。アイディエーション段階は質より量が重要です。
何か思いついたら、スケッチブックを開いて描きなぐるようにストーリーボードを作ります。
たとえば宇宙船のブリッジシーンやコックピット視点の場面では、大勢のクルーが動き回ったり、モニターに情報が映し出されたりと複雑な演出が求められます。「動くストーリーボード」にすることで、誰がどのタイミングでどの位置にいるかが一目瞭然になり、実制作入る前に演出の方向性を確立することができます。
以前ご紹介したKatalist(Storyboard AI)、かなり良いのですが、本プロジェクトのコンテンツ制作ではオーバースペックなので導入は見送っています。
生成AIを駆使して1人で制作する映画「COLORS」のお知らせ
公開は2月13日。
映画(ショートムービー)公開および動画生成AIによる映画メイキング解説/映画のメイキングデータをセッションに来場された方々と共有します。
※ネット公開は予定されていません。
場所はAdobe MAX Japan 2025が開催される東京ビッグサイト。
セッションの申し込みは、今月14日(火)から。
※入場できる人数が決まっているので、すぐ埋まる可能性があります。
2025年最初のライブ配信(Creative.Edge Live 第68回目)は、13日(月)を予定しています。
お正月は大雪で(除雪作業などの)生活労働の日々だったので、ライブ配信できませんでした…
関連記事:
更新日:2025年1月10日(金)/公開日:2025年1月10日(金)