
画像生成AIで最も優れているKLING v1.6 (※2025年1月現在) - OpenAI Soraと比較する/ Blog - 2025/01/10
第3世代の画像生成AIで最も優れているKLING v1.6 (※2025年1月現在)を検証
12月19日、第3世代の動画生成AIの中で最も評価の高かった「Runway Gen-3 Alpha」が、KLING の新バージョン1.6に追い抜かれてしまいました。
KLING v1.6は、あらゆる場面でRunwayやSoraより期待した結果を得られており、映像制作において使用頻度が高くなっています。
今日は、難易度の高いシーンの検証結果を掲載します。
宇宙服のヘルメットをとり、歩き出すシーン
以下の動画をご覧ください。
KLING v1.6の生成ビデオは、プロンプトのとおり、宇宙服の女性がヘルメットをとり、歩き始めます。
Soraはヘルメットが変形したり、体の一部なったり、ハルシネーションが目立ちます。Runwy Gen-3 Alphaも同様にうまく表現できません。
平均10回程度、生成していますが結果はほぼ同じです。
プロンプト:
A young Russian woman with short hair takes off the heavy helmet of her steel powered suit, which looks like armor, and takes a deep breath, her hair flying around. She is standing in a space force hangar, which is scattered with old, rusty, broken equipment and parts. Several maintenance workers are moving around her.She throws her helmet away and starts to walk slowly.
テキストプロンプトだけでビデオ生成(Text to Video)
再生時間:48秒
前半はKLING v1.6、後半はOpenAI Sora
このシーンの場合は、KLING v1.6が最も優れていることがわかります。
ただ、宇宙服のデザインは1980年代のSFドラマのような懐かしさがあり、ビジュアルセンスは今ひとつ。
逆に、Soraは(プロンプトどおりに動いてくれませんが…)ビジュアルはとてもスタイリッシュ。
2人の刑事が犯人を追うシーンを生成
ピンクヘアーの女性と黒人男性の刑事が犯人を追って走っているシーンを生成してみました。
こちらもKLING v1.6が最も安定した映像を生成しています。Soraは、歩きや走りの途中でコマ飛びのように引っかかります。動画をご覧ください。明らかに違います。
A scene from a suspense movie. A young Russian woman with short pink hair and wearing a black suit is an excellent detective. She and her partner, a black male detective, are chasing a criminal through the backstreets of New York. Rubbish is scattered around the alley, and dust and dirt are flying in the air.
テキストプロンプトだけでビデオ生成(Text to Video)
再生時間:22秒
前半はKLING v1.6、後半はOpenAI Sora
KLINGは、v1.6になって他の動画生成を一歩リードしています。
Runway Gen-3 Alphaは追い抜かれてしまいました。
問題は「クレジット」です。
KLINGは無制限のプランがありません。最上位のプランを契約しても、すぐにクレジットを消費しますので、追加購入することになってしまいます。
無制限のRunwayやSoraのような使い方をすると、毎月3〜5万円くらい支払うことに(もっとかかるかも…)。
個人的に期待したいこと。
無制限プランのあるRunwayやSoraの性能をKLING v1.6レベルに上げてほしい。あるいは、KLINGに無制限プランを追加してほしい。
映画ストーリーボード
映画(ショートムービー)「COLORS」の制作が進行中ですが、今日は「動くストーリーボード」をご紹介します。
以下の例は、サウンドデザインのプロセスで使うストーリーボードで「ラジオドラマ」に紙芝居が付加されたような形式で、ビジュアルイメージを確認したいときに作成します。
キャラクターの声はAI音声合成(VOICEPEAK)、音楽生成はSuno AIを使っています(以下のストーリーボードには音楽は入っていません)。
効果音だけはマーケットプレイス(Envato)から素材データを購入しています。効果音生成は品質が低いので使えませんでした。
シーン設定:
There are many police vehicles and patrol cars parked at the crime scene. The scene of the crime. There are police and detectives. It's night in New York. A young female detective with short pink hair is talking to a coroner.
もっとラフに作る場合は、Adobe Fireflyを使います。
ほぼ紙芝居です。
動くストーリーボード(ラフ)
再生時間:55秒
プロトタイピングでは、手間をかけず素早く作ることが鉄則なので、紙芝居で十分。アイディエーション段階は質より量が重要です。
何か思いついたら、スケッチブックを開いて描きなぐるようにストーリーボードを作ります。
たとえば宇宙船のブリッジシーンやコックピット視点の場面では、大勢のクルーが動き回ったり、モニターに情報が映し出されたりと複雑な演出が求められます。「動くストーリーボード」にすることで、誰がどのタイミングでどの位置にいるかが一目瞭然になり、実制作入る前に演出の方向性を確立することができます。
以前ご紹介したKatalist(Storyboard AI)、かなり良いのですが、本プロジェクトのコンテンツ制作ではオーバースペックなので導入は見送っています。

生成AIを駆使して1人で制作する映画「COLORS」のお知らせ
公開は2月13日。
映画(ショートムービー)公開および動画生成AIによる映画メイキング解説/映画のメイキングデータをセッションに来場された方々と共有します。
※ネット公開は予定されていません。

場所はAdobe MAX Japan 2025が開催される東京ビッグサイト。
セッションの申し込みは、今月14日(火)から。
※入場できる人数が決まっているので、すぐ埋まる可能性があります。

2025年最初のライブ配信(Creative.Edge Live 第68回目)は、13日(月)を予定しています。
お正月は大雪で(除雪作業などの)生活労働の日々だったので、ライブ配信できませんでした…
関連記事:
更新日:2025年1月10日(金)/公開日:2025年1月10日(金)