見出し画像

Pika1.0とRunway Gen-2の比較/[1]映像クリエーターのための生成AI - Blog 2024/03/09

映像クリエーターのための生成AI[1]・ダイジェスト版

毎月開催している報告会からの抜粋シリーズ「映像クリエーターのための生成AI」の第1回は、現時点で推奨できる動画生成AI「Pika 1.0」と「Runway Gne-2」の概要についてのダイジェスト版です。

※報告会セレクトシリーズは、誰でも容易に利用できるサービス化された動画生成AIを対象としています。OpenAIのSoraなど、論文やデモ映像しか公開されていない技術は含まれません。

生成AIのサービスは頻繁にアップデートが実施され、新機能が追加されたり仕様が変わりますので記事の「更新日」をご確認ください。


動画生成AIはまだ進化の途中

誰でも試すことが可能な動画生成AIが登場したのは、2023年2月以降であり、まだ1年しか経っていません。技術進化はまだ続いており、詳細な評価は時期尚早と考えています。
画像生成AIが不得意な表現を探求するより、既存の動画技術や映像演出とのハイブリッドな創作を目指す方が良いでしょう。

生成AIのタイムライン(抜粋)


以下は、Runway Gne-2とPika 1.0 を使用して制作したショートムービーです。Pikaの方は、新機能のリップシンクを活用しています。

Runway Gen-2 を使用した映像:

  • 再生時間:25秒

  • ビデオ生成:Runway Gne-2

  • 音楽:Suno AI /画像生成:Midjourney V6 (alpha)/編集:After Effects

  • 制作日:2024/03/06

Pika 1.0 を使用した映像:

  • 再生時間:24秒

  • ビデオ生成:Pika 1.0

  • 音楽:Suno AI /画像生成:Midjourney V6 (alpha)/編集:After Effects

  • 制作日:2024/03/07


Runway Gen-2 とPika 1.0、大きな差がなく、どちらが優れているかを決めるのが難しいです。両方を使いながら試していくしかありません。

Runway Gen-2 ワークスペース
Pika 1.0 ワークスペース




1. 動かす画像のアップロード

Runway Gen-2とPikaには、「Text to Video(テキストからビデオ生成)」と「Image to Video(画像からビデオ生成)」があります。
報告会では、後者の「Image to Video」を検証対象にしており、MidjourneyやFireflyなどの画像生成AIで生成した画像を使用します。
※Pika 1.0は「Video to Video(ビデオからビデオ生成)」も実行できます。

例:以下の生成画像を使用します。

Front of Pose Collection, full body center view profile photography, White background, A 70-year-old fashion designer, he has white hair and wears a black leather jacket --ar 16:9 --s 150 --style raw

Midjourney V6 (alpha) による生成画像

生成画像(PNGファイル)をドラッグしてアップロード
Runway Gen-2は左上のプレビュー領域、Pika 1.0は下部に画像ファイルをドラッグします。

Runway Gen-2 の画像アップロード後の画面
Pika 1.0 の画像アップロード後の画面

ワークスペースのメインパネルのUI
どちらもカメラ設定等の基本機能は備わっていますが、Gen-2には「モーションブラシ(動かす領域を指定できる)機能」、Pika 1.0には「リップシンク機能」が搭載されています。

Runway Gen-2とPika 1.0の基本機能

最新情報(3月9日):
効果音の生成(Sound effects)機能が早期アクセス可能になっています(3月9日現在)。PROプランのみ利用できます。

Pika 1.0 の効果音生成


2. ビデオ生成

実行ボタンをクリック、もしくはEnterキーを押すと生成がスタートします。どちらも、1分前後で生成されますが、Gen-2は「4秒」、Pika 1.0は「3秒」です。

  • Runway Gen-2[生成ビデオの秒数:4秒/最大16秒まで]

  • Pika 1.0[生成ビデオの秒数:3秒/最大15秒まで]

Runway Gen-2の生成結果
Pika 1.0の生成結果

デフォルト設定のまま生成した結果

生成AIなので「実行する度に生成結果が異なります」が、Gen-2とPikaの傾向はかなり異なります。
Gen-2は時間の経過と比例して画像が破綻しやすく、4秒以上のビデオ生成には注意が必要です。人物の顔が別人に変化したり、モーフィングすることがあります。Pikaの方が一貫性を保っていますが、動きの制御はGen-2に劣っています。
総合的な評価では、Runway Gen-2が若干勝っていると思いますが、大きな差ではありません。

  • Runway Gen-2[サイズ:1408 x 768/再生時間:4秒]

  • Pika 1.0[サイズ:1280 x 720/再生時間:3秒]

※参考:アップロードした(Midjourney V6 (alpha)による)生成画像のサイズは「1456 x 816」

Runway Gen-2(左)とPika 1.0(右)の生成結果


3. アップスケーラー

Gen-2、Pika 1.0どちらにもアップスケーラーが搭載されています。
アップスケールすると2倍のサイズになります。

  • Runway Gen-2[アップスケールサイズ:2816 x 1536]

  • Pika 1.0[アップスケールサイズ:2560 x 1440]

Gen-2は、オプションアイコンをクリックして、「Upscale」をチェックします。アップスケールしない場合は、忘れずにチェックを外しておいてください。

Runway Gne-2 のアップスケール設定

Pika 1.0は、生成された画像のプレビュー右下のオプションアイコンからアップスケールを実行できます。

Pika 1.0 のアップスケール設定

報告会では、どちらのアップスケーラーも推奨していません。
もし、品質を重視したアップスケールを実行したいなら、「Topaz Video AI 4」などの専用ツールをお奨めしています。

Topaz Video AI 4


4. モデレーションシステム

米国の大統領選挙の期間中は、どの生成AIサービスもモデレーションシステムを強化することが予想されます(Midjourneyはすでに強化することを表明しています)。
特に動画生成AIは、フェイクビデオに悪用される可能性が高いため、投稿監視が強化される見込みです。
OpenAI のSora、一般公開が可能だったとしても間違いなく、大統領選挙が終わってから….でしょう。

Runway Gen-2の投稿監視:

  • 幼い子どもの生成は、児童ポルノ対策でブロックされます。ガイドライン違反していない問題のない画像も「幼い子ども」と認識されるとブロックされ、生成することができません。何度も試みるとアカウント停止になる可能性があります。ただ、生成されることもあるので注意が必要です。

  • 暴力的な表現もブロックされます。例えば、ゾンビ映画のシーンなどは高確率でブロックされ、生成不可になります。

  • 意図せず不快な映像が生成された場合も生成不可になります。

  • ブロックされて生成不可になったビデオは、クレジットを消費しません。

  • Terms of Use Agreement(利用規約)

Pika 1.0の投稿監視:

  • 情報が不足しています(まだブロックされたことはありません)。
    ブロックされた方がいたら情報提供お願い致します

  • terms of service(利用規約)


参考:
以下は、Runway Gen-2でブロックされた画面です。生成された画像はスーパーヒロインのファイティングポーズですが、暴力的なイメージとして誤認識されたようです。ブロックされると生成はできませんが、問題ない画像であることをフィードバックすることは可能です。
尚、Pika 1.0では生成できます。

Runway Gen-2 でブロックされた生成ビデオ


5. 費用

生成AI活用はGPU消費との戦いであり、利用者も費用を負担することになります。大半の生成AIサービスはクレジット制とサブスクリプションを導入しています。
動画生成は、画像生成より高負荷のため料金も高いです。
どちらも、無料プランがありますので、誰でも無料で試すことが可能です。ただし、提供されるクレジットが少ないため、あくまで「体験版」の位置づけです(クレジットはあっという間に消費します)。
Pikaの無料プランは、250クレジット(25回生成)提供され、使い切ると、毎日30クレジット(3回生成)付与されます。Runwayも125クレジット提供され25回生成できますが、使い切ると使用できなくなります。

  • Runway の料金ページ
    ※以下のスクリーンショットは月払いです。年払い表示に切り替えると20%OFFになります。

  • GPU消費:4秒で5クレジット消費
    Basic(無料):125クレジット(使い切ると使用不可)
    Standard:毎月625クレジット
    Pro:毎月2250クレジット
    Unlimited:無制限
    Enterprise:要相談

  • クレジットの追加購入:1000クレジットを10ドルで購入可能
    ※Basic(無料)プランでは購入できない

  • 商用利用:Standardプラン以上

  • 参考:How do credits work ?(消費するクレジットについて)

Runway の料金が掲載されているページ(月払い)
  • Pika の料金ページ
    ※以下のスクリーンショットは月払いです。年払い表示に切り替えると20%OFFになります。

  • GPU消費:3秒で10クレジット消費
    BASIC(無料):250クレジット/使い切ると毎日30クレジット付与
    STANDARD:毎月700クレジット/使い切ると毎日30クレジット付与
    UNLIMITED:毎月2000クレジット/使い切ると毎日30クレジット付与
     ※使い切っても2~3倍遅いモードで生成できる
    PRO:無制限

  • 商用利用:PROプランのみ

Pika の料金が掲載されているページ(月払い)

本格的な動画生成にはお金がかかります。
Microsoftとのパートナーシップで膨大な計算資源を持つOpenAIでも、Soraのサービス化では、RunwayやPikaを上回る高額サブスクリプションになるのでは…(そもそもサービス化できるのか疑問です) 


6. Stable Video について

Stability AIが提供している「Stable Video(Stable Video Diffusion 1.1)」は、まだベータ期間中のため検証対象にしていませんが、誰でも使用することができますので、概要を掲載しておきます。

Stable Videoのページ

Stable Videoは、Runway Gen-2やPika 1.0に近いUIになっています。「Text to Video(テキストからビデオ生成)」と「Image to Video(画像からビデオ生成)」があります。

Stable Videoのインターフェース

生成結果は概ね良好で、Runway Gne-2で発生するモーションの破綻も少なく、Pika 1.0のような画質劣化も少ないですが、アップロードする画像の内容によっては極端に崩れることがあります。

Stable Videoの生成ビデオ

現在、まだベータ期間中でサブスクリプションなどは設定されていません。毎日150クレジット(私は110クレジットでした)付与されます。Image to Video(画像からビデオ生成)は、4秒生成で10クレジット消費します。

  • Text to Video(テキストからビデオ生成):11クレジット消費

  • Image to Video(画像からビデオ生成):10クレジット消費

クレジットは購入することが可能です。
500クレジットで10ドル、3,000クレジット50ドルで購入でき、有効期限は今のところ設定されておらず、余ったクレジットは繰越すことができます。
※毎日付与される無料クレジットは1日ごとにリセットされます。

Stable Videoの追加クレジットの購入ページ

ベータ期間が終了し、正式バージョンリリース時には、無料で付与されるクレジット数などが変更される可能性がありますので、ご注意ください。


第2回に続きます。
※毎月開催している報告会からの抜粋記事です。詳細は報告会のアーカイブページをご覧ください。


第12回 生成AIとクリエイティブ報告会のお知らせ

  • 3月30日(土)の報告会です。以下の告知ページで申し込みできます。

  • まだ、3週間先ですが参加枠が残り10になっております…(3月9日現在)


動画生成AIの可能性」マガジンをフォローしておくと、最近記事・最新情報の通知が届きます。


更新日:2024年3月9日(土)/公開日:2024年3月9日(土)

いいなと思ったら応援しよう!