建築ビジュアルCG AI活用法⑬~動画生成AI 8選・比較 検証~
こんにちは。STUDIO55技術統括の入江です。
今回は、話題のリアル系動画生成AIを比較・検証します。
どのAIプラットフォームもサンプルを見る限りでは高いクオリティを誇り、驚くものばかりです。
しかし、実際には各ジェネレーターには得意とするジャンルがあり、AIの学習ベースによって差が出ることがあります。また、「リアル系」と称されるプラットフォームでも、動画生成のクオリティにはそれぞれに違いが見られます。
特に建築ビジュアルの生成では、「建築のビジュアルを多く学習したAIがより良い結果をもたらす」と考えるのが一般的です。そのため、建築やインテリアに特化したAIを選ぶのが最適と思いがちですが、リアル系動画生成AIは、その専門性を超えるクオリティを誇ります。
ここでは、世界的に注目されるリアル系動画生成AIを中心に比較し、さらに建築系動画生成AIとの違いも含めて検証します。
それぞれのツールが提供する映像クオリティの違いを明確にし、建築的表現に最適なプラットフォームを選定するため、実際に生成した映像も参考にしながら解説します。
📒テスト概要
✒ 生成内容
「テキストからビデオ」と「画像からビデオ」の2通りの生成で検証。
✒ 検証プラットフォーム一覧
-リアル系AI生成動画-
・Haiper
・Runway Gen-3 Alpha
・Dream Machine
・KLING AI
・Pika
・Genmo
🎞「テキストからビデオ」比較
テキストで生成する際、特にAIジェネレーターの個性が顕著に現れます。何をベースに学習しているかによって、同じテキスト内容でも、生成されるイメージがまったく異なることがあります。
言葉から想起するイメージは人間でもそれぞれ異なるように、AIも学習環境によって生成されるイメージが変わる点で人間に似ています。
今回のテストでは、未来のネットワーク社会をテーマに試してみたいと思います。単なる建築外観ではAIの学習データに基づいた判断が難しくなるため、あえて限られた表現枠内でどのような生成が行われるかを確認します。
共通して使用したテキスト(プロンプト)は、以下になります。
未来ネットワークを表す事例はいくつかありますが、この内容から、皆さんならどのような画を思い浮かべますか?
では、AIに映像を生成してもらいます。
・リアル系動画生成AI
・Haiper
・Runway Gen-3 Aplha
・Dream Machine
・KLING AI
・Pika
・Genmo
・建築系動画生成AI
・LookX AI
・Prome AI
いかがでしょうか。
かなり差が出ましたね。
どれが一番良い印象でしたでしょうか?
👉参考コメント
参考として、以下に私の所感をコメントします。
・Haiper
Haiper ならではの独創的で美しいビジュアルとアングル構図。想像の斜め上をいくクォリティを描き出してくれました。
リアル系動画生成AIで俯瞰アングルで生成しなかったのは、このハイパーだけです。
・Runway Gen-3 Alpha
もっとも ”未来のネットワーク” のリアリティ要素を詰め込んだディテールです。海風をよける円形状の大屋根や、巨大な洋上風力。突き出す半島からつなげた洋上都市の描き込みなど、かなり好印象。動画のクォリティにおいても素晴らしいものがあります。
・Dream Mchine
非常にシンプルな描写ですが、 ”スカイマイルタワー” や "ジッダタワー" のような超高層建築のフォルムを思わせる生成は、このDream Machineだけでした。この点で、Dream Machineの学習ベースが異なる印象を受けます。
👉 スカイマイルタワー(Sky Mile Tower) : 清水建設が提案した超高層ビルのコンセプトで、高さは約1,700メートル(5,577フィート)で、東京湾に建設される計画です。未来の都市インフラの一部として考案されています。※ブルジュ・ハリファの2倍以上の高さ!
👉 ジッダタワー(Jeddah Tower) : 以前はキングダムタワー(Kingdom Tower)と呼ばれていましたが、サウジアラビアのジッダに建設中の超高層ビルで、高さは1,000メートル(3,281フィート)を超える予定と言われています。世界で初めて1キロメートルを超える建物となる予定で、商業、ホテル、住宅、オフィススペースを含む多用途ビルです。サウジアラビアのビジョン2030プロジェクトの一環として開発されています。
・KLING AI
海上の白波アニメーションなど、細かな点からクォリティを描いている点で、CGアニメーションの表現センスを思わせます。学習ベースがクリエイティブCGや映画関係の映像にあるのではないかという印象を受けます。
描いた都市は、Dream Machineとは真逆の低層フォルムで、どことなく韓国・釜山のオセアニックスプロジェクトや、モルディブ・フローティング・シティ計画を彷彿とさせる現実味があります。
・Pika
映像のディテール感やカメラアニメーション等は今一つですが、描いた内容としてはイギリスのデザイナーPhil Pauley(フィル・パウリー)氏の「Sub Biosphere 2 」の半円形のフォルムを発展させるものが感じられ、これはこれで好みの場合があるかもしれません。
👉 Sub Biosphere 2:英国の発明家フィル・パウリー(Phil Pauley)が設計した水中居住システム。このプロジェクトは、気候変動や海面上昇に対する適応策としても注目されており、持続可能な未来の生活空間のモデルとして考えられています。
・Genmo
映像のクォリティ面でPikaに次いでモーフィングノイズが強く見られ、やや難を感じます。描かれたイメージは、シーステーディング研究所の「浮島プロジェクト(Floating Island Project)」のアレンジのように映ります。洋上の船舶などをアニメーション表現したのはgenmoだけでした。
👉 浮島プロジェクト(Floating Island Project): このプロジェクトは、環境に優しい設計を採用し、再生可能エネルギー、淡水生成、廃棄物管理などの持続可能な技術を利用して、完全に自給自足できるように設計されています。浮島はモジュール式で、さまざまな用途(住宅、商業、農業、観光など)に対応できるように構築されます。
・LookX AI
リアル系動画生成AIと一変した見せ方になりました。
建築動画ならではの逆光の演出や、建築への視点アプローチにおいて、派手ではない分、建築的要素の構図が感じられます。
👉 リアル系のハイクォリティ動画生成が、全般的に HD(1280×720) でアウトプットされるのに対し、LookXは最も小さめな WSVGA(1024×576)でアウトプットされています。
・Prome AI
リアル系と正反対な絵のテイスト感で、カメラアニメーションはなく、空と水面のみのアニメーションとなっています。アングル的には建築での見せ方をふまえた画角ではあるものの、アニメーションとしては、かなり低いレベルです。
👉 動画生成としては珍しい、1344 x 768 (7:4) で生成されました。
16:9の比率で言えば FWXGA(1366 x 768)になるはずですが、かなり端数なアスペクト比です。これは、SDXLの画像生成設定で見られたりする比率ですが、あくまで一般的なものではありません。
Prome AIの比率設定にあるテンプレートには、驚くほどの種類が備わっています(下画像参照)。そこでも7:5はあっても 7:4はありません(!?)。デフォルトが 7:4になっているとしたら、必ず設定において比率を指定しておく必要がありそうです。ご注意ください。
🎞画像からビデオ比較
「画像からビデオ」で使用する画像は、(以前のコラム記事で紹介した)こちらのAI生成した画像を用います。
👉 カメラモーション設定はデフォルトのままです。
・リアル系動画生成AI
・Haiper
・Runway Gen-3 Aplha
・Dream Machine
・KLING AI
・Pika
・Genmo
・建築系動画生成AI
・LookX AI
・Prome AI
いかがでしょうか。
静止画からアニメーションが作成できる時代がきた、といった感慨を含め、どれがより良い表現でしたでしょうか?
👉参考コメント
参考として、以下に私の所感をコメントします。
・Haiper
破綻のない安定した映像クォリティは、Haiperならではといった感想で、好感が持てます。
・Runway Gen-3 Aplha
異次元なクォリティレベルです。
「画像からビデオ」生成で、画像にはない別アングルでスタートする例など、これまで見たことがありません。画像では見えていない箇所まで生成し、見事なウォークスルーアニメーションで仕上げています。
また、反射表現に弱いAIアニメーションにおいて、わざわざここまでの反射表現をしてくるのも、その高い性能をアピールするようにも伺え、とても驚かされます。
👉 Gen-3 Aplhaは、カメラの動きや照明まで、すべてをテキスト(プロンプト)で設定することができる最新技術を搭載した動画生成AIです。特に今回は、カメラの動きは指定はしていませんので、画像内容から解析して、見せ方を把握して生成しているということです。
単に空間をカメラパンやズームではなく、建築・インテリアに必要とされるウォークスルーの見せ方を把握して生成しているとしたら、かなり驚きです。
sora 超えの巷での評判は、さすがといったところです。
・Dream Mchine
Haiper同様、破綻のない安定した内容で、非常に素晴らしい出来上がりです。また、Haiperのズームアニメーションと異なり、回り込みながらのカメラワークが生成されており、Gen-3 Aplhaに並ぶ性能を伺わせます。奥の壁面絵画が、Haiperではモーフィングされたのに対し、Dream Machine ではしっかり固定されている点なども注目に値します。
ある意味、余計なことをしない、という見せ方においては、Gen-3 Alphaとの使い分けの参考になりそうです。
・KLING AI
内観の動画生成には特に向いていない事が確認できます。KLINGはフォトリアルな静止画や動画を生成する話題のAIですが、より被写体が明確な場合に向いているのかもしれません。
参考までに、KLING AIで生成したオフィスチェアの画像を載せておきます。
・Pika
Pikaのアニメーションはどれも微妙なカメラアニメーションの傾向があります。その分、映像の破綻はありませんが、この内容であれば、動画編集ソフトを使った静止画のズームアニメーションで十分に間に合いそうです。
・Genmo
Genmoは、映像の破綻やモーフィングノイズが出やすい傾向があり、クォリティ系と呼ぶには今一つ及ばない感想です。
👉 Genmoは1年ほど前に設立されたばかり企業です。アメリカのサンフランシスコのベイエリアを拠点としており、現在も求人を募集しています。エンジニアとして働く場合は、ベイエリア付近への移住が条件です。
これからの展開に期待したいAIジェネレーターの1つです。
・LookX AI
LookX AIは、カメラの動きの後半にかけて映像の破綻が出てくる傾向がありました。途中までの映像であれば使えそうですが、その分、映像尺を短くトリミングすることになります。
・Prome AI
Prome AIは、全体に画質が低く、”少し前のAI動画のクォリティ” の感想です。安定性は確保されていますが、クォリティ面でやや難があるといった印象です。
総評
今回の比較検証は、あくまで建築ビジュアルに使用する際の目安としての評価です。生成するシーンによって、どのプラットフォームが最適かは依然として未知数な部分もありますが、各AIプラットフォームの傾向性はある程度把握できたのではないでしょうか。
全体的に優れた結果を出したのは、「Haiper」「Gen-3 Alpha」「Dream Machine」の3つだと感じています。注目される動画生成AIの中でも、これら3つは特に優れており、トップレベルの性能を示しました。それぞれ異なる特徴があるため、描きたい映像の内容に応じて使い分けることが必要だとも考えられます。
👉 商用利用を目的とする場合は、各AIプラットフォームの利用規約を必ず確認してください。たとえば、Dream Machine は月に30回まで無料で使用できますが、商用利用には有料プランの契約が必要で、無料プランでの商用利用は禁止されています。
このように、各プラットフォームの利用条件には注意が必要です。
●動画編集新時代『Adobe Firefly Video Model』
今月(2024年9月)11日、Adobe は「Firefly Video Model」を発表しました。このモデルでは、テキスト、カメラコントロール、参照画像を使用して動画を生成でき、既存のリアル系動画生成AIと並ぶ高いポテンシャルを持つとされています。公開された情報では、その性能の高さが強調されています。
動画におけるAIの進化は、今後ますます勢いを増します。多くの作業を必要とされてきた動画編集が、より時短、より効果的、より刺激的にできる時代がすぐそこまで来ています。
『ビデオ編集の新時代』の到来です。
*
今後もAI業界の勢力図が変化することが予想されますが、どこまで便利な機能が実現されるのか、期待が高まります。