![見出し画像](https://assets.st-note.com/production/uploads/images/147944790/rectangle_large_type_2_5f2c23b8f7696bfa84945960c3771b73.png?width=1200)
MidjourneyとLLMで新規性の高いイメージを導き出す/Runway Gen-3 AlphaによるMV制作 - Blog 2024/07/20
明日、日曜(21日)の夜9時45分頃からライブ配信します。
MV制作の最新ワークフローと新規性の高いイメージづくりのベストプラクティスをご紹介します。
MV制作の最新ワークフローは、ライブ配信で解説しますが、新しいビジュアルの表現方法について簡単に記しておきます。
最初に、Midjourney V6で強度の高いトークンを使ってベースとなるコンセプトイメージを生成します。
![](https://assets.st-note.com/img/1721482792442-NZ1SaoALyO.png?width=1200)
Personalizationパラメータを追加して自分の好みのイメージにします。
画像生成でオリジナリティを出すには(自分の嗜好を学習させて)パーソナライズするしかないので、Fireflyや他の画像生成AIにも欲しい機能。
![](https://assets.st-note.com/img/1721482792642-WMMyP3OIJA.png?width=1200)
ChaosパラメータとWeirdパラメータを使って、自分の創造力の限界を突破し独創的なビジュアルを見つけ出し、同時にインスピレーションを受けつつ、刺激の度合いで複数のカテゴリに分けていきます。
雑貨店でビンテージマガジンやポストカードを物色している感じ…です。
![](https://assets.st-note.com/img/1721482994835-AtS6VfSUfA.png?width=1200)
ChaosパラメータとWeirdパラメータはプロンプトを無視してランダムに生成します。つまり、プロンプトは無いに等しいので、再現したい生成画像はLLMで解析してプロンプト化します。
![](https://assets.st-note.com/img/1721484092788-3WbBCZyt2m.png?width=1200)
LLMで生成したプロンプトに必要なパラメータを付加して、ビジュアルイメージを生成します。
元の生成画像が全てPersonalizationパラメータで自分好みになっているので、びっくりするほど「自分が表現したい」イメージばかり生成されます。
しかも、ハルシネーションのおかげで飽きない。
![](https://assets.st-note.com/img/1721484092859-8pp3D1qkvu.png?width=1200)
プロンプトに動的表現を追加して、Runway Gen-3 Alphaでビデオ生成します。もし、生成したビデオのビジュアルイメージが良かったら、スクリーンショットをLLMで分析、プロンプト化してMidjourney V6でさらに膨らませます。
![](https://assets.st-note.com/img/1721484092908-igBRvix4qH.png?width=1200)
静止画と動画に垣根はなく、自由に行ったり来たりできる夢のようなクリエイティブが実現しています。
![](https://assets.st-note.com/img/1721490109806-gVI11pM1bQ.png?width=1200)
Personalizationパラメータで自分の好みを反映したイメージに、ChaosパラメータとWeirdパラメータで自分の創造力を拡張する。プロンプト入力とは異なる生成方法ですが、こっちの方が「人間の能力を強化」している感じ。
生成する度に、「そうそう、こんな絵が欲しかった」の連続。これこそ「脱テキストプロンプト」の最も顕著なやり方といえるでしょう。
![](https://assets.st-note.com/img/1721482514666-Iuqwba1fPX.png?width=1200)
![](https://assets.st-note.com/img/1721488520864-bscXvuGpW6.png?width=1200)
そして、この自分好みのビジュアルが直ちに映像になるのですから、まさに妄想の具現化。
![](https://assets.st-note.com/img/1721482514773-7t67Rzjq2d.png?width=1200)
![](https://assets.st-note.com/img/1721488578408-xb1oQKkheY.png?width=1200)
![](https://assets.st-note.com/img/1721511812893-QXfxtqRDgY.jpg?width=1200)
時代劇のチャンバラのシーンも、そこそこ動かせるようになってきたので、1年前にMidjourneyで作成した紙芝居ムービー「鬼の国」を映像化してみた。
試行錯誤が終わったらライブで紹介します。
たった1年でここまで技術が進み、お金を払えば誰でも利用できるという環境が出来上がってしまった。OpenAI Soraがどのようなサービスになるのか期待が高まる。単独の「製品」として提供されるのか、ChatGPTの1つの「機能」として提供されるのか….
動画生成AIは、この先「世界モデル」へまっしぐら。
映像分野だけではなく、NVIDIA Omniverseのようなプラットフォームの標準的な機能になったり、ロボティクスでも応用されるはず。
今は… 悪用されないことを願うばかりです。
パンドラの箱を開けてしまったLuma Dream MachineはGPU使用料の高さが抑止になっていますが、Klingがちょっとこわい。SNSと安易に結びつくとインプレッション稼ぎで度を超えたビデオが生成されるので…
それでは明日のライブ配信でお会いしましょう。
「動画生成AIの可能性」マガジンをフォローしておくと、最近記事・最新情報の通知が届きます。
更新日:2024年7月20日(土)/公開日:2024年7月20日(土)