4Kのビデオが生成可能になったRunway Gen-3 Alpha (新機能のアップスケーラーを検証)/現状での活用可能な領域/ Blog - 2025/01/11
4Kのビデオが生成可能になったRunway Gen-3 Alpha
昨日(10日)、Runway Gen-3 Alphaにアップスケーラーが実装されました。数日前から一部ユーザーには解放されていましたが、現在は全ての有料ユーザーが使用できるようです。
4Kは通常「3840 x 2160ピクセル」ですが、Runwayのアップスケーラーは「5120 x 3072ピクセル」の画像を出力します。
ダウンロードした以下の10秒のビデオは、183MBもあります。
フルHDのSoraとKLING(の生成画像)が小さく感じます。
Runway Gen-3 Alpha [ 1280 x 768 ]
OpenAI Sora, KLING AI [ 1920 x 1080 ]
Runway Gen-3 Alpha - 4K Upscale [ 5120 x 3072 ]
なぜ、2Kではなく、いきなり4Kアップスケーラーを優先したのか疑問ですが、Googleが発表していた動画生成AI「Veo 2」の4K出力のインパクトは吹き飛んだ感じです。他の動画生成AIも4K対応してくるでしょう。
ただ、プロ仕様のアップスケーラーと比較すると、Runwayの4KよりTopaz Video AI 6を使用した方が高品質です。
現在進行中の映画制作では、4KアップスケールにTopaz Video AI 6を使っていますので、Runwayも2K出力の方が有り難いです(2Kの追加を期待します)。
動画生成の高解像度化は想像以上のスピードで、こんなに早く4Kアップスケーラーが実装されるとは思いませんでした。
問題は、やはり「ハルシネーション」です。
高解像度になるほど、ハルシネーションが目立ちます。自然描写や顔のクローズアップなどは実写と区別できないレベルですが、人間の骨格や指や歯、群衆や看板の文字など、ハルシネーションがひどい部分は凄まじい違和感があります。
今はまだ、高解像度になっても、ハルシネーションが目立たない(手振り身振りがない)表情だけの人物とか、抽象的な表現が求められる風景、エフェクト、ハルシネーションがプラスに働く非現実的な存在など、用途は限定的です。
現状での活用可能な領域
背景・環境描写
自然風景やアーバンスケープなど、静的な環境
リアリティよりも抽象的な表現が求められるシーン
限定的な人物表現
インタビューシーンのような、比較的静的な人物表現
(動きが少ない)表情のみのクローズアップ
(細部が見えにくい)遠景の群衆表現
特殊効果・クリエイティブ表現
ハルシネーションによる新奇性が期待できる超自然的な現象や特殊効果
ファンタジー世界の表現やクリーチャーなど非現実的な存在
それにしても、いきなり「5120 x 3072ピクセル」ですか….
画像じゃなくて、映像 (ビデオ)でここまできました。
生成AIを駆使して1人で制作する映画「COLORS」のお知らせ
公開は2月13日。
映画(ショートムービー)公開および動画生成AIによる映画メイキング解説/映画のメイキングデータをセッションに来場された方々と共有します。
※ネット公開は予定されていません。
場所はAdobe MAX Japan 2025が開催される東京ビッグサイト。
セッションの申し込みは、今月14日(火)から。
※入場できる人数が決まっているので、すぐ埋まる可能性があります。
関連記事:
更新日:2025年1月11日(土)/公開日:2025年1月11日(土)