
動画生成AIのAmazon Nova ReelでJAWS DAYS応援動画を作成
今年も幸いな事に、会社にスポンサーになっていただけました。
去年は3Dが出来る方にお願いして、Xポスト用の応援画像を作っていただきました。メールでイメージをお願いしたら、MTGの際にはすでに完成していたというスピードとクオリティーで、本当に素晴らしい作品でした。私も「3Dをやりたい」という思いで転職してきただけに、そのスキルの高さに大変刺激を受けました。
JAWS DAYS 2025はドット絵のゲーム風がテーマということで、そのコンセプトに沿った画像もしくは映像制作を検討しました。社内には素晴らしい技術とセンスをお持ちの方々がたくさんいらっしゃいますが、年度末の繁忙期と重なり、今回は難しい状況でした。
そこで新しい挑戦として、Amazon Nova Reelを活用して自分で制作することにしました。
動画生成AI、Amazon Nova Reel
2024年12月のAWS re:Invent 2024で電撃発表されたAmazon Nova Reelについては、次のサイトをご参照ください。
[速報]Amazon、自社開発の基盤モデル「Amazon Nova」発表。テキストから画像や動画の生成、マルチモーダルまで対応
Amazon Nova のご紹介: フロンティアインテリジェンスと業界をリードする料金パフォーマンス
CVRは8倍、CPAは73%減
動画生成AIの可能性については、以前LT登壇しました。
いまググったところ電通デジタル様のサイトで、Amazon Nova Reelの記事があるのを見つけました。ご参照ください。
『∞AI AdsにAmazon Nova Reelを導入。大きな成果を上げたGDO、カカクコム、アパホテルでの活用事例を紹介 AWS re:Invent 2024登壇レポート』
生成AIで背景を動画に置き換えただけで、CVRは8倍、CPAは73%減に
動画を作ることが非常に簡単になったということです。たとえば、「AWSと電通デジタルがAIを通じてコラボレーションしている動画を作成したい」といったプロンプトを入力すると、7つのシーンで構成されたストーリーボードのプロンプトを得ることができました。そして、そのプロンプトを1つずつ順に「Amazon Nova Reel」に入力し、生成された7つの動画を組み合わせる、それだけでできてしまいます。
上記記事にあった手法をまねる事にしました。
JAWS DAYS 2025応援動画のコンセプトやプロンプトは、AWS GenUを使って、生成AIに作成してもらいます。
AWSマネージドコンソールのAmazon Nova Reelプレイグランドに、出来たプロンプトを入力し、シーン毎の動画を生成します。その後、フリーソフトを使って1本の動画にまとめあげます。
当社キャラクターは猫のイラストですが、これをそのまま動かすのは出来ない事はLT登壇した際に検証済みなので、アニメ・イラスト風ではなく「実写」で作成する方針に決めました。
生成AIに相談してコンセプトと脚本を作成

Claude 3.5 SonnetとAmazon Nova Proにそれぞれ同じ文章を入力して、出てきた脚本を比べました。ただどうやったら意外性のある脚本になるのかプロンプトが分からなくて、自分が思いついた内容に変更していきました。
Amazon Bedrockプレイグランドで動画生成
Amazon Nova Reelについては次のブログを参照して、プロンプトは日本語でまずやってみる事にしました。
バージニア北部リージョンのAmazon Bedrockプレイグランドです。




プロンプト:オフィスにいる眼鏡をかけたスーツ姿の男性が、突如として人型の猫に変身する。

約5分待って出てきた動画が、これです。イメージと違い過ぎました。

グーグル翻訳で英訳したものをプロンプトにしました。
人間の顔から猫の顔に変身してくれるのが理想なのですが、これで良しとします。
A man in a suit and glasses in an office suddenly transforms into a humanoid cat.

以降、試行錯誤を繰り返します。
Amazon Nova Reel prompting best practicesには、「ビデオ生成モデルのプロンプトは、大規模言語モデル (LLM) のプロンプトとは異なります。ビデオ生成モデルには、明示的なコマンドを推論または解釈する機能がありません。」と書いてありました。
他にも、次のサイトを参照しました。
日本語で考えたプロンプトを英語に翻訳してから、再度プレイグラウンドから実行してみたり、思いつくまま動画生成を試してみました。短い動画を今回のテーマを考えて、取捨選択や並べ替えをしました。

OpenShotで一つの動画にまとめ上げる
OpenShotというオープンソースの動画エディタソフトを見つけましたので、使わせていただきました。実際に動画をくっつけていくと「不要だな」と感じる箇所も出てきましたので切り取ったりしました。操作方法は検索して調べていきました。

ナレーションは、テキスト読み上げサービスのAmazon Pollyを使用しました。
英語は、生成AI>英語(米国)>Ruth、女性で生成しました。
日本語は、ニューラル>日本語>Tomoko、女性だったと思います。

OpenShotでナレーションのmp3ファイルを動画に追加するのも、かなり簡単でした。動画ファイルの別トラックにmp3ファイルを追加すると、ナレーション入り動画が完成しました。
まだ誰もAmazon Nova Reelで「応援動画」という形では作成していなかったと思うので、アイディアを実現できたこと、とても嬉しく思いました。
作業時間の関係で、プロンプトの試行錯誤はほとんど出来なかったのですが、実写ではありえない表現が出来たので、非常に満足しております。
是非、探してみて視聴いただけると、とても喜びます。
Amazon Nova Reelは、活用したい小ネタが1個あるので、こちらも実際に実現させるために頑張っていきます。
終わりに、宣伝です。
JAWS DAYS 2025で登壇する機会を得ました。エンジニアとして、一生に一回の大舞台かと思うので、しっかりとスライドを準備して当日を迎えます。
TRACK F、お祭りトラック「スピーカービギナーズ&個人サポーター限定LT大会」でLT登壇する機会を頂き、大舞台にすでに緊張💦。テーマは勿論、生成AI🧠Amazon Bedrockと2月末に新発表が控えていると噂のアレ🔊です。乞うご期待! #jawsdays2025 #jawsug #jawsdays2025_f https://t.co/vaGPonwNSN pic.twitter.com/vJh7S7nBNc
— 長田英幸 (@nagata_hideyuki) February 12, 2025