
Midjourney V6.1の隠された表現力を引き出してみた(実は凄かった) /その後の検証報告 - Blog 2024/08/13
先日リリースされたMidjourney V6.1は、Aesthetic SystemのCreativityが高めに調整されており「AI顔」になりやすい仕様に変わりました(V5.2に近い感じです)。
近々リリース予定のV6.2でまた戻るかもしれませんが、個人的にはプロンプトの書き方が面倒になってしまい、あまり良い印象ではなかったのですが、その後の検証でちょっと変わってきました。
Stylizeパラメータの加減とPersonalizationで驚くほど品質が向上し、V6.1の性能の高さを初めて実感。
検証用プロンプト例:
Facial Expression, film still, Bare face without makeup, thick-lipped, Skin Details, Super cute thick-lipped Russian girl, She has short brown hair, She is a hip-hop R&B dancer, Ultra-high definition film images, Detail-oriented photography, Her eyes are as beautiful as sapphires, shiny/glossy, kawaii --ar 16:9 --style raw --v 6.1

V6.0
このナチュラルな感じが好みだったのですが…

V6.1
過度に美化する調整によってAI顔に近づく。

Raw
そこで、美化しないようにStylizeを0にしてから…

Personalization
自分の好み(AIトレーニング)を反映させます。
Facial Expression, film still, Bare face without makeup, thick-lipped, Skin Details, Super cute thick-lipped Russian girl, She has short brown hair, She is a hip-hop R&B dancer, Ultra-high definition film images, Detail-oriented photography, Her eyes are as beautiful as sapphires, shiny/glossy, kawaii --ar 16:9 --style raw --s 50 --p --q 2 --v 6.1

かなり良いです。
ナチュラルさが戻り(当然ですが)品質はV6.0より向上しています。

パラメータ値とPersonalizationで、どこまで性能を引き出せるか?
プロンプトの言葉選びでは不可能だということがわかったので、複数アカウントで異なるPersonalizationを実行し、用途に応じたカスタムモデル化みたいなやり方は有効かもしれませんね。

このレベルまでいけるなら、動画生成のリファレンスとしても十分機能します。現時点で最も高品質なRunway Gen-3 Alphaでビデオ生成。
RunwayのText to Videoではこのクオリティは出せませんが、Midjourney V6.1の生成画像をリファレンスにすると、ここまで表現できるようになります。
Creative Upscalerなどは使用していません。
ここまで来てしまったか!という…
恐ろしいですね。
再生時間:48秒
再生時間:45秒
Gen-3 Alphaのプロンプト:
Handheld shot: She speaks expressively.

V6.1のリリース時は、「たんなるマイナーアップデート、V6.2のフィードバック目的」などと書きましたが、訂正します。
かなり調整されています。素晴らしい品質だと思います。
AIトレーニングで自分好みの絵づくりをするので、プロンプトだけでは真似できない。クリエーターにとって(Midjourneyを使う他者と)差別化できる重要な要素だと言えるでしょう。
ただ….
プロンプトの書き方が難しい。
まず、計画的にPersonalizationを機能させ(トレーニングし)、パラメータ値でコントロールする必要があります。
初心者はどうやって学べばよいのでしょう?
誰かがYouTubeやUdemyなどにわかりやすい学習コンテンツを公開してくれるはず。待ちましょう…
Create your own personalized images on midjourney.com and use the personalization parameter on your images.
When you Rank Pairs and like images from the community, Midjourney takes note of the kinds of images you prefer and can generate images for you based on those preferences.
「Midjourney高精細画像の研究」マガジンをフォローしておくと、最近記事・最新情報の通知が届きます。
更新日:2024年8月13日(火)/公開日:2024年8月13日(火)