見出し画像

画像生成AIで最も優れているKLING v1.6 (※2025年1月現在) - OpenAI Soraと比較する/ Blog - 2025/01/10

第3世代の画像生成AIで最も優れているKLING v1.6 (※2025年1月現在)を検証

12月19日、第3世代の動画生成AIの中で最も評価の高かった「Runway Gen-3 Alpha」が、KLING の新バージョン1.6に追い抜かれてしまいました。
KLING v1.6は、あらゆる場面でRunwayやSoraより期待した結果を得られており、映像制作において使用頻度が高くなっています。
今日は、難易度の高いシーンの検証結果を掲載します。


宇宙服のヘルメットをとり、歩き出すシーン

以下の動画をご覧ください。
KLING v1.6の生成ビデオは、プロンプトのとおり、宇宙服の女性がヘルメットをとり、歩き始めます。
Soraはヘルメットが変形したり、体の一部なったり、ハルシネーションが目立ちます。Runwy Gen-3 Alphaも同様にうまく表現できません。
平均10回程度、生成していますが結果はほぼ同じです。

プロンプト:

A young Russian woman with short hair takes off the heavy helmet of her steel powered suit, which looks like armor, and takes a deep breath, her hair flying around. She is standing in a space force hangar, which is scattered with old, rusty, broken equipment and parts. Several maintenance workers are moving around her.She throws her helmet away and starts to walk slowly.

  • テキストプロンプトだけでビデオ生成(Text to Video)

  • 再生時間:48秒

  • 前半はKLING v1.6、後半はOpenAI Sora

このシーンの場合は、KLING v1.6が最も優れていることがわかります。
ただ、宇宙服のデザインは1980年代のSFドラマのような懐かしさがあり、ビジュアルセンスは今ひとつ。
逆に、Soraは(プロンプトどおりに動いてくれませんが…)ビジュアルはとてもスタイリッシュ。


2人の刑事が犯人を追うシーンを生成

ピンクヘアーの女性と黒人男性の刑事が犯人を追って走っているシーンを生成してみました。
こちらもKLING v1.6が最も安定した映像を生成しています。Soraは、歩きや走りの途中でコマ飛びのように引っかかります。動画をご覧ください。明らかに違います。

A scene from a suspense movie. A young Russian woman with short pink hair and wearing a black suit is an excellent detective. She and her partner, a black male detective, are chasing a criminal through the backstreets of New York. Rubbish is scattered around the alley, and dust and dirt are flying in the air.

  • テキストプロンプトだけでビデオ生成(Text to Video)

  • 再生時間:22秒

  • 前半はKLING v1.6、後半はOpenAI Sora

KLINGは、v1.6になって他の動画生成を一歩リードしています。
Runway Gen-3 Alphaは追い抜かれてしまいました。

問題は「クレジット」です。
KLINGは無制限のプランがありません。最上位のプランを契約しても、すぐにクレジットを消費しますので、追加購入することになってしまいます。
無制限のRunwayやSoraのような使い方をすると、毎月3〜5万円くらい支払うことに(もっとかかるかも…)。

個人的に期待したいこと。
無制限プランのあるRunwayやSoraの性能をKLING v1.6レベルに上げてほしい。あるいは、KLINGに無制限プランを追加してほしい。



映画ストーリーボード

映画(ショートムービー)「COLORS」の制作が進行中ですが、今日は「動くストーリーボード」をご紹介します。
以下の例は、サウンドデザインのプロセスで使うストーリーボードで「ラジオドラマ」に紙芝居が付加されたような形式で、ビジュアルイメージを確認したいときに作成します。

キャラクターの声はAI音声合成(VOICEPEAK)、音楽生成はSuno AIを使っています(以下のストーリーボードには音楽は入っていません)。
効果音だけはマーケットプレイス(Envato)から素材データを購入しています。効果音生成は品質が低いので使えませんでした。

シーン設定:

There are many police vehicles and patrol cars parked at the crime scene. The scene of the crime. There are police and detectives. It's night in New York. A young female detective with short pink hair is talking to a coroner.

  • 動くストーリーボード

  • 再生時間:55秒

  • 登場人物の声:VOICEPEAK(AI合成音声)

  • 画像:Midjourney v6.1 /効果音:Envato

もっとラフに作る場合は、Adobe Fireflyを使います。
ほぼ紙芝居です。

  • 動くストーリーボード(ラフ)

  • 再生時間:55秒

プロトタイピングでは、手間をかけず素早く作ることが鉄則なので、紙芝居で十分。アイディエーション段階は質より量が重要です。

何か思いついたら、スケッチブックを開いて描きなぐるようにストーリーボードを作ります。
たとえば宇宙船のブリッジシーンやコックピット視点の場面では、大勢のクルーが動き回ったり、モニターに情報が映し出されたりと複雑な演出が求められます。「動くストーリーボード」にすることで、誰がどのタイミングでどの位置にいるかが一目瞭然になり、実制作入る前に演出の方向性を確立することができます。


以前ご紹介したKatalist(Storyboard AI)、かなり良いのですが、本プロジェクトのコンテンツ制作ではオーバースペックなので導入は見送っています。

Katalist


生成AIを駆使して1人で制作する映画「COLORS」のお知らせ

公開は2月13日。
映画(ショートムービー)公開および動画生成AIによる映画メイキング解説/映画のメイキングデータをセッションに来場された方々と共有します。
※ネット公開は予定されていません。

2月13日に公開(リアルな場所での公開のみ)

場所はAdobe MAX Japan 2025が開催される東京ビッグサイト。
セッションの申し込みは、今月14日(火)から。
※入場できる人数が決まっているので、すぐ埋まる可能性があります。

Adobe MAX Japan 2025

2025年最初のライブ配信(Creative.Edge Live 第68回目)は、13日(月)を予定しています。
お正月は大雪で(除雪作業などの)生活労働の日々だったので、ライブ配信できませんでした…


関連記事:


更新日:2025年1月10日(金)/公開日:2025年1月10日(金)

いいなと思ったら応援しよう!