カメラもモデルも不要!? になってしまうのか。
AI技術を用いて、リップシンクを活用した映像制作をテストしました。
この技術は、人物が実際に話しているかのような映像を生成するもので、AIインフルエンサーの登場に大きく貢献する可能性があります。
この進歩により、デジタルコンテンツ制作の一部分野は大きな転換期を迎えています。特に、ストックフォト・映像業界では、AIが既存の素材を基に新たなコンテンツを生成することで、市場の大部分のニーズを満たせる可能性が出てきました。
結果として、ストックフォト分野では実際の撮影やモデルの起用が必要なケースが限定的になるかもしれません。つまり、この業界ではカメラもモデルも不要となるシーンが増える可能性があるのです。
ただし、これはストックフォト業界に特有の状況です。広告、ファッション、ドキュメンタリーなど、他の写真・映像分野では、依然として人間の感性や技術、実際の撮影が不可欠です。たぶん。
このような状況下で、特にストックコンテンツのクリエイターは、自身の役割と価値提供の方法を再考する必要がありそうです。
テスト結果
FLUX.1 [dev] + Leonardo.AI + Claude + Amazon Polly + Runway Gen-3 Alpha
制作手順
1.
FLUX.1 [dev]で画像生成
2.
Leonardo.AIを使用して画像の解像度を向上させ、全体的な画質を改善します。
解像度を上げるツールは複数存在し、用途に応じて使い分けています。
コストと画質のバランスを考慮した結果、私は主にLeonardo.AIを利用しています。
Leonald.ai (PR)
Stable Diffusion
3.
Claudeを活用して、映像用の台詞を生成します。
AI-driven future of work. Can you imagine it?
AIが支える明日の働き方。どんな可能性が見えますか?
4.
Amazon Polly を利用して、生成したテキストを自然な音声に変換します。
5.
Runway Gen-3 Alpha を使用して、生成した画像を動画化し、音声に合わせてリップシンク(口の動き)を適用します。
AI技術の進歩は目覚ましいですね。ディープフェイク技術が注目を集める中、用途によっては完全にAIで映像を生成することが可能になりそうです。
私も複数のツールを試してみましたが、それぞれに長所短所があり、細かな設定も可能なため、一概にどれが最良とは言えません。より詳細なテストを行えば、結果に違いが出る可能性もあります。しかし、総合的に判断すると、現時点ではRunwayが最も可能性を秘めているように思います。
ただし、この業界の技術革新のスピードは非常に速く、今すべてのツールを徹底的にテストしても、その結果が来週には陳腐化してしまう可能性があります。そのため、常に最新の動向に注目し、柔軟に対応していくことが重要でしょう。
以下に、Runway以外の様々なAIツールを使用して作成したサンプル映像をご紹介します。
FLUX.1 [dev] + Luna Dream Machine + sync.labs
FLUX.1 [dev] + Kling AI + sync.labs
FLUX.1 [dev] + Pika + sync.labs
FLUX.1 [dev] + immersity AI + sync.labs
上記で使用したリップシンクのツール
FLUX.1 [dev] + hedra 別のリップシンクのツール