見出し画像

AI美女が出演するMVを制作する方法

AI美女たちが出演するミュージックビデオを作成してみました。

今回のnoteでは、このような動画を作成する方法について、ざっくりと解説します。

AIを用いた動画制作に興味がある方の参考になれば嬉しいです!


動画作成の大きな流れ

AIで動画を作成するときのおおまかな手順は

  1. 画像生成で素材を作る

  2. 動画生成で動きをつける

  3. 編集ソフトで仕上げる

順番に説明していきます。

1. 画像生成で素材を作る

ベースとなる美女を作成しましょう

ベースとなる美女

最初にやることはベースとなる美女の画像を作成することです。

ChatGPTDALL-E 3を使って作成しました。

打ち込んだプロンプトがこちら

create image 
beautiful woman
23-year-old Japanese woman
big eyes 
blonde hair 
bob hair
height 167cm
black outfit
dim lighting
16:9

画像生成するときには、なるべく英語でプロンプトを打ちましょう。
英語の方が日本語よりも出力が安定するらしいです。
さっきのプロンプトを日本語に訳すとこんな意味です。

画像を生成してください
美女
23歳の日本人女性
大きな目
金髪
ボブヘアー
身長167cm
黒い衣服
薄暗い照明
16:9

生成された画像がこちら

すごく好みの美女が生成されました…!

何点かポイントを解説します。

1.人種を指定する

意外と盲点なのですが、人種を「日本人」と明確に指定しましょう。
日本人の私たちからすれば、人種を何も指定しなかったら日本人の画像を作るのが暗黙の了解だと感じますが、DALL-E 3はそこのところ空気を読んではくれません。「美女」や「金髪」という他の単語に引っ張られて、欧米風の女性の画像を生成してしまいます。

2.16:9にするのを忘れずに

動画用の画像を作成したいので、アスペクト比を16:9に指定するのを忘れないようにしましょう。デフォルトだと1:1に近い画像が生成されてしまいます。

3.金髪ボブにした理由

個人的に金髪ボブの童顔が好きだから

…いや、それもあるんですが、他にもちゃんと理由があります。

3-1. キャラクターの特徴づけ

われわれ日本人は黒髪です。そのため、黒髪の場合、生成された美女の顔がわずかに違うだけでも全くの別人という認識になりがちです。

一方、金髪ボブという特徴的な髪型にしていると、それだけで強くキャラづけがされ、わずかに顔が違うだけならざっくり同一人物だという認識がされやすいです。例えるなら、日本人の顔は覚えやすいけれど、欧米人の顔ってみんな一緒に見えてしまって覚えづらくないですか?それと同じです。

3-2.知っている人に似てしまうリスク回避

生成した顔がたまたま知っている人に似ていた、というリスクを回避する上でも、金髪ボブにしておくのは有効です。その人の生活環境にもよるでしょうけれど、ごく普通の会社員なら身の回りにド金髪の人はあまりいないでしょう。

3-3.楽曲の世界観

これは汎用的な理由ではないですが、今回の楽曲の世界観的に、金髪ボブの女の子の方が似合っています。

派生させて素材を増やしましょう

次に、先ほど作成した美女をベースとして他にも素材を増やします。

そのために、画像IDシード値というものを取得します。

画像IDとシード値を教えて

とプロンプトを打つと

画像IDは xxxxxxxxxxx で、シード値は 0123456789 です。

と教えてくれるので、次回からはこれらの情報もいっしょに指定します。

何を言ってるのか分かりづらいと思うので例を示しますね。

夜の公園でブランコに乗っている素材を作る場合のプロンプト

imageID: xxxxxxxxxxx
seed: 0123456789
She is swinging in the park at night

こんな感じで、画像IDとシード値を指定した上で
"She is 〜"と生成したい画像について説明します。

生成された画像がこちら

可愛らしさとやさぐれ感のバランスが絶妙

このように、画像IDとシード値をいっしょに指定することで、最初に作成したベースとなる美女の雰囲気を踏襲しつつ、指定したシチュエーションの画像を生成することができました。

同じ要領で素材を何枚も作っていきます。もちろん、ボツになってしまうような画像が生成されることもありますが、めげずに生成していきましょう!

2. 動画生成で動きをつける

素材の準備ができたらそれらを動画にしていきましょう。Runway Gen-3を使用することで画像に動きをつけることができます。

Generative Video

Runway Gen-3Generative Video という機能で、こちらの美女にダンスをさせてみます。

電線の下にいる美女の画像
zoom out, she is dancing

カメラワークはズームアウトという指定をした上で、彼女がダンスをしているというシチュエーションを入力します。

生成された動画がこちら(mp4を埋め込めないのでGIFを載せています)

踊る美女

身体がクネクネしすぎだったり、腕が不自然にしなったりしていますが、それだけでボツにしてはいけません。この動画全体を使うのではなく、自然に見えるところだけをカットしたり、動画の速度を変更したり、編集ソフトのエフェクトを活用するなど、手を加えることで、MVとして使うことができます。

使用シーン(1)

使用シーン(2)

さて、これはとても重要なことなのですが、AIを利用した動画制作では生成された素材をそのまんま使うのではなく、自分なりの一手間を加えて工夫することが重要です。「不自然な箇所をどのように自然に見せるか」「どのように自分のイメージに近づけるか」ということを考えて、カットしたり、速度を変えたり、エフェクトをかけたり、工夫をしていきましょう。

Lip Sync Video

Runway Gen-3Lip Sync Videoという機能を使うと、歌に合わせて口パクをさせることもできます。画像と音声をアップロードすることで、口パク動画が生成されます。

口パクする美女

3. 編集ソフトで仕上げる

動画素材ができたら、動画編集ソフトを使って加工したりつなげたりしていきいます。エフェクトを追加したり、フィルターをかけたり、トランジションをつけたりすることで「それっぽい」動画に仕上げていきましょう。

さきほども言及しましたが、生成された動画素材をまるごとそのまま使うのではなく、必要に応じてカットしたり、速度を変えたり、エフェクトフィルタートランジションを加えたり、一手間を加えることによって、生成AIで作られた不自然な動画でも「それっぽい動画」にすることができます。

費用

動画制作にかかる費用はこんな感じです。

  • Suno AI(音楽生成):$10.00 / month

  • DALL-E 3(画像生成):$20.00 / month

  • Runway(動画生成):$35.00 / month

合計すると月額¥10,000ぐらいです。

趣味で使用するにしてはちょっと高いですかねえ〜。
ただ、商用利用しないのであれば無料で使えます。
また、動画制作をプロに依頼すると数万円〜数十万円かかってしまうことを考慮すると、かなりリーズナブルだと思います。

まとめ

AI美女の出演するMVを制作する方法について、ざっくりと解説しました。

分かりづらい点もあったかと思いますが、AIを使った動画制作の参考にしていただけたらうれしいです!

この記事が気に入ったらサポートをしてみませんか?