
API公開で変わるビジネス - 動画生成AIとアプリ連携が生み出すイノベーション
AIメディアを運営する男性2人が"ながら聞きでも未来がわかる"をテーマに30分で生成AIのトレンドを解説するPodcast「AI未来話」。
このnoteでは番組のエピソードからトピックをピックアップして再構成したものをお届けします。※この記事は95%がLLM「Claude」で執筆しています。
今回は「#29 API公開で変わるビジネス - 動画生成AIとアプリ連携が生み出すイノベーション」を再構成した内容をお届けします。
Runwayの急成長とクリエイター重視の戦略
アーティストのためのAIツール開発
我々は最近、動画生成AI領域で注目すべき動きがあることを認識しています。
特にRunwayが発表したGen-3 Alphaにおいて、ビデオtoビデオ機能がリリースされ、最大10秒の動画変換が可能となりました。
Introducing Gen-3 Alpha: Runway’s new base model for video generation.
— Runway (@runwayml) June 17, 2024
Gen-3 Alpha can create highly detailed videos with complex scene changes, a wide range of cinematic choices, and detailed art directions.https://t.co/YQNE3eqoWf
(1/10) pic.twitter.com/VjEG2ocLZ8
この機能の主な特徴は、実写動画をアニメーションに変更したり、セピア調や白黒の古い雰囲気に変換したりするスタイル変更機能です。
Runwayは2019年に設立された比較的若い企業です。
CEO兼共同創設者のクリストバル・バレンズエラ氏は、経済学と経営学を学んだ後にデザインの修士号を取得し、大学でデザインを教えていました。
しかし、AIアートの作品に魅了され、突然教職を辞してニューヨーク大学に入学するという異色の経歴の持ち主です。
テクノロジーとアートの融合
バレンズエラ氏は大学でテクノロジーとアートを主に学び、2年間にわたってプログラミングや機械学習、画像生成技術を学習しました。
Runwayは、彼の研究論文をもとに生まれた生成AIです。
特筆すべきは、Runwayがアートとしての側面を非常に重視していることです。
バレンズエラ氏自身が「アーティストのためのAIツールを作ることが目的」と明言しています。
私たちの目標は、映画制作者が Runway をどのように使用するかを考えることではありませんでした。私たちの役割は常に、そのツールを映画制作者の手に渡し、彼らが適切な使用方法を見つけられるようにすることです。
アーティストとAIの関係性
我々は、AIに対するアーティストの批判的な見方についても理解しています。
自分の作品が無断で学習に使用されることへの懸念や、仕事が失われる不安などが存在します。
しかし、バレンズエラ氏は「AIはあくまでもアーティストのためのツール」という立場を明確にしています。
カメラマンがPhotoshopやLightroomを使用することを特別視しないのと同様に、アーティストがAIを活用することも自然なことだと考えています。
Adobeとの競合関係
Adobeの動画生成AI参入
我々は、動画生成AI市場における新たな展開として、AdobeがAdobe Fireflyビデオモデルを発表したことに注目しています。
Adobe Fireflyのビデオモデルを搭載した #PremierePro を年内に公開予定!
— アドビ クリエイティブ クラウド (@creativecloudjp) April 16, 2024
生成拡張で動画のクリップを長くしたり、動画内のオブジェクトの追加や削除、テキストからの動画生成だけでなく、サードパーティ製の #生成AI も直接使用可能に🙌
乞うご期待!https://t.co/Ym0UhADVIx pic.twitter.com/2GGPCkNQMu
現時点ではテキストtoビデオとイメージtoビデオの機能のみですが、今後のPremiere Proとの統合が予定されています。
この動きは、クリエイティブツール市場に大きな影響を与える可能性があります。
バレンズエラ氏とAdobeの因縁
興味深いことに、バレンズエラ氏はRunway創業前にAdobeへの入社を誘われていました。
また、Runwayの共同創業者であるマタマラ氏は一度Adobeに入社しましたが、その後独立してRunwayの創業に参加しています。
このような経緯から、RunwayとAdobeには一種の因縁めいた関係が存在しています。
市場競争の展望
我々は、この競争関係について複雑な見方をしています。
Adobeの動画生成AI導入は、そのネットワーク効果の強さから、Runwayにとって大きな脅威となる可能性があります。
一方で、Runwayはアーティスト寄りのアプローチを取ることで、差別化を図っています。
特にユーザーエクスペリエンス(UX)の面で、より使いやすく、アート寄りのツールを目指していることが特徴です。

動画生成AI市場の激化する競争
新たなプレイヤーの台頭
我々は、動画生成AI市場が急速に変化していることを実感しています。
以前はRunwayとPikaの2社が二大巨頭とされていましたが、最近はKlingやDream Machineなどの新興プレイヤーが台頭し、市場構造が大きく変化しています。
Megalophobia Alert!! 🚨🚨
— Kling AI (@Kling_ai) January 14, 2025
👀 Welcome to the KLING AI Aquarium 🦈🐙🦀🦭#KlingAI #aquarium #AIart pic.twitter.com/CBuiFSEUcI
Say hello to the all-new #DreamMachine. 🚀 Your visual thought partner—where ideas become reality. Ideate, visualize, and share your ideas with the world. Available now. pic.twitter.com/1NhexUa0Xl
— Luma AI (@LumaLabsAI) November 25, 2024
特に現在は、Runway、Kling、Dream Machineの3社が三大動画生成AIとして認識されつつあります。
DreamMachineの技術的特徴
Dream Machineを開発しているLuma AIは、NERF(Neural Radiance Fields)という技術を活用し、個人的な瞬間を現実的に表現することに特化しています。
この技術は、複数の視点からの画像をデータとして入力し、機械学習を用いて3Dシーンを再現する能力を持っています。
Luma AIは3Dモデルの生成が可能なGenieや、動画から3Dモデルを生成可能なInteractive sceneなどのサービスも提供しており、3D技術と動画生成の融合を目指しています。
モバイルファーストの戦略
Dream Machineの特徴的な点として、iPhoneでの利用を重視していることが挙げられます。
「iPhoneで誰もが3Dクリエイターに」というビジョンのもと、Luma AIのサービスはすべてスマートフォンで動作するよう設計されています。
GenieやInteractive sceneはアプリとして提供され、Dream Machine自体もスマートフォンのウェブブラウザーで利用可能です。
APIの開放がもたらす変革
API公開の意義
我々にとって、大きな転換点となったのが、RunwayとDream Machineが相次いでAPIを開放したことです。
RunwayのAPI公開は9月16日、Luma AIのAPI公開は9月17日と、ほぼ同時期に実施されました。
Today we're announcing the Runway API, allowing developers to easily integrate Gen-3 Alpha Turbo into their apps and products.
— Runway (@runwayml) September 16, 2024
Already in use by trusted strategic partners like @Omnicom, you can now learn more and sign up for the waitlist: https://t.co/hLgy7JuwGW
🚀 Introducing the Dream Machine API. Developers can now build and scale creative products with the world's most popular and intuitive video generation model without building complex tools in their apps. Start today https://t.co/rtDKtZ5kTW #LumaDreamMachine pic.twitter.com/olyBa1vxON
— Luma AI (@LumaLabsAI) September 16, 2024
このAPIの開放により、アプリケーションと動画生成AIの連携が飛躍的に進むことが予想されます。
Luma AIの未来構想
Luma AIのCEOであるアミット・ジェイン氏は、「新しい没入型の方法で人々をつなぐメディアを構築したい」というビジョンを掲げています。
これは単なる動画生成に留まらず、メタバースの文脈で語られる「世界シミュレーター」としての展望を示しています。
我々は、この方向性がRunwayのアーティスト向けツール開発とは異なり、3Dを活用した世界構築に重点を置いているという特徴を持っていると考えています。
ビジネス応用の多様な可能性
API連携がもたらす興味深い可能性の一つとして、思い出の3D化があります。
例えば、亡くなったペットの写真をアップすると3Dモデルを生成し、部屋の中を走り回る様子を再現するといったサービスも、APIで動画生成AIを動かせれば実現が可能になります。
他にも、不動産業界では物件紹介サイトとAPIで連携することで写真から動画を生成して、3Dで室内の様子を確認できるといったサービス展開も考えられます。
不動産業界での活用に加え、通販サイトでの応用も期待されます。
商品の紹介動画を自動生成したり、ユーザーが投稿した写真を3D化して商品イメージを分かりやすく伝えたりすることが可能になります。
これにより、オンラインショッピングにおける商品理解度の向上が期待できます。
また、旅行業界では、観光地の紹介動画を自動生成することで、より魅力的な旅行プランの提案が可能になります。
Runwayのアーティスティックな演出能力を活用することで、視覚的に印象的な旅行動画を作成できます。
クリエイターのワークフロー改革
我々は、APIの開放がクリエイターの業務効率を劇的に改善する可能性を秘めていると考えています。
例えば、3Dモデルの制作において、従来は手間のかかった作業が大幅に効率化されます。
初期の簡易的な3DモデルをRunwayのAPIで処理することで、より洗練された立体的なモデルに変換できるようになります。
これにより、クライアントへの提案スピードが飛躍的に向上し、より多くの選択肢を提示することが可能になります。
API料金と今後の展望
現時点でのAPI料金は、1クレジットあたり1セント(約1.5円)で、1秒のビデオ生成に5クレジットが必要です。
つまり、5秒の動画を生成するのに約40円のコストがかかります。
我々はこの価格設定について、現時点では高額であると認識していますが、GPTモデルのAPIと同様に、今後モデルの進化とともに料金が低下していくことを期待しています。
まとめ
動画生成AI市場は、RunwayとDream MachineによるAPI公開を契機に、大きな転換点を迎えています。
特にRunwayのアーティスト向けアプローチとDream Machineの3D技術の融合により、不動産や旅行業界など、様々な分野での活用が期待されます。
また、Adobeの参入により市場競争が激化する中、各社の特色を活かした開発が進んでいます。
APIの開放は、アプリケーションとの連携を促進し、新たなビジネス機会を創出する可能性を秘めています。
我々は、これらのツールをクリエイターが積極的に活用することで、表現の幅が広がり、業務効率が向上すると考えています。