見出し画像

AWSの動画生成AI、Amazon Nova Reelで動画生成してみた

AWS re:Invent 2024で新しいAWSの生成AIが発表されました。

公式ページ:
Amazon Nova Foundation Models

公式ブログ:
Introducing Amazon Nova: Frontier intelligence and industry leading price performance

What'New:
Announcing Amazon Nova foundation models available today in Amazon Bedrock

  1. Amazon Nova Micro, a text only model that delivers the lowest latency responses at very low cost.

  2. Amazon Nova Lite, a very low-cost multimodal model that is lightning fast for processing image, video, and text inputs

  3. Amazon Nova Pro, a highly capable multimodal model with the best combination of accuracy, speed, and cost for a wide range of tasks.

  4. Amazon Nova Canvas, a state-of-the-art image generation model.

  5. Amazon Nova Reel, a state-of-the-art video generation model.

一度に5種類もリリースされてAWSの気合を感じます。
いわゆる生成AIの、文章を生成するタイプ、画像を生成するタイプに加えて、今回初めて動画生成が出来る基盤モデルが発表されました。

Amazon Nova Reel

最先端のビデオ生成モデルの動画生成を試してみます。
Amazon Nova ReelはAmazon Bedrockに今回追加された基盤モデルですので、もちろんAPI経由で呼び出せます。
初めてなのでプレイグランドで試しました。

プロンプトは「楽しそうに踊るウサギのキャラクター」です。

Novaの名前で連想される、NOVAうさぎが動画生成できるか試してみます。
英会話教室NOVAのマスコット「NOVAうさぎ」特設サイト

ここからは初めて設定される方向けに、手順を書いていきます。

モデルアクセスの設定

バージニア北部リージョンのAmazon Bedrockで、モデルアクセスからNova Reelを使えるように申し込んでください。


プレイグランドのImage/Video

プレイグランドのImage/Videoをクリックします。たぶん数時間もしたら更新されると思うのですが、Titan Image Generator G1とSDXL 1.0しか表示されていないので動画生成できないと思われるでしょうが、「モデルを選択」をクリックしてください。


モデルを選択

「モデルを選択」がポップアップされるので、AmazonをクリックするとNova Realが選べるようになります。そしたら「適用」をクリックしてください。

赤矢印の箇所をクリック

赤矢印の箇所をクリックすると、プレイグランドが広くなります。


NOVAうさぎさんで試してみます

NOVAうさぎ様の公式サイトから切り抜いた画像をアップロードしてみました。プロンプトは「NOVAうさぎ、という名前のキャラクターがロックに踊ります。」にしました。
では「実行」をクリックします。


「The provided image must have dimensions in set [1280x720]. Try again with a valid image.」とエラーが出ましたので、調整してもう一度試します。


画像をアップロード

The supported image types are png, jpeg. Image size must be 1280 width, 720 height, and up to 10MB each.



This request has been blocked by our content filters. Please adjust your text prompt to submit a new request.
このリクエストはコンテンツ フィルターによってブロックされました。新しいリクエストを送信するには、テキスト プロンプトを調整してください。

コンテンツフィルターに怒られました。


5分くらいかかるそうです。

なぜか冒頭のウサギの動画が出来たのでやり直します。
今度は推論イメージに画像をアップロードするのではなく、プロンプトを工夫してみます。



ピンク色のウサギのキャラクターがロックに踊ります。

プロンプト「ピンク色のウサギのキャラクターがロックに踊ります。」でかわいいウサギのキャラクターが踊る動画が出来ました。

速報という事で、以上になります。

いいなと思ったら応援しよう!