Midjourney V6(alpha)のための新しいプロンプトエンジニアリング探求の準備 - Blog 2023/12/21
V6 (alpha) と V6(full release)をわける
Midjourney Model V6 (alpha) のAesthetic systemを探求する準備を開始しました。アルファバージョンの試行錯誤は、完全版(full release)で通用するノウハウにならない可能性がありますので、V6 (alpha) と V6(full release)を異なるバージョンとして扱っていきたいと思います。
以下の記事の続きです。
V6 (alpha) のAesthetic system
V5との比較は前回の「Midjourney V6とV5はまったく別のもの! 大半のプロンプトは共有できない 」をご覧ください。
今回は、V6 (alpha) の探求を実施します。
※V6 (alpha) と V6(full release)は別けます。V6 (alpha) は調整中のバージョンなので、アルファバージョンのノウハウが V6(full release)で通用しない可能性があるからです。
V5のプロンプト:
V6 (alpha) では、高画質表現を狙った「photorealisticや4K、8K、フィルム名やレンズ等」のプロンプトは不要になりましたので、V5のプロンプトを参考にする場合、全て省きます。
Midjourneyからのアナウンス(Discord )
Style and prompting for V6
Prompting with V6 is significantly different than V5. You will need to 'relearn' how to prompt.
V6 is MUCH more sensitive to your prompt. Avoid 'junk' like "award winning, photorealistic, 4k, 8k"
V6 (alpha) では不要なワード、フレーズ:
super detail
photorealistic
maximal facial detail
fujifilm XT4
V6 (alpha) 用のプロンプト:
こんなに短くなります…
以下は、最小限のプロンプトです。
これだと、空間周波数が高すぎるので調整する必要があります。
今回は、V5との比較はしませんが、前回の復習として、どれだけ異なるのか確認しておきます。同じプロンプトをV5.2で生成すると以下のようになります。
V5.2の方が、プロンプトで意図したイメージ(クールな70歳の男性)になっています。
V6 (alpha) は、単なる「写真」ですね…
プロンプトの共有は無理だということがわかると思います。
Midjourneyからのアナウンス(Discord )
Style and prompting for V6
Be explicit about what you want. It may be less vibey but if you are explicit it's now MUCH better at understanding you.
If you want something more photographic / less opinionated / more literal you should probably default to using --style raw
V6 (alpha) では、より明確にイメージを伝えるように、と記載されていますので、「映画に登場するかっこいい70歳の男性」にしてみます。
まずは、テストプロンプト用に「film still」を追加。
多少「クールなおじいさん」に近づきましたが、「older man with dark sunglasses」のように具体的に書かないとダメそうですね。
それでは、V6 (alpha) で「かっこいい70歳の男性」を表現するプロンプトを書いてみます。「--style raw」を付加して、Aesthetic systemを軽減させます(プロンプトに対する忠実度を高めます)。
かなり良い感じになりました。
V5.2だと、超リアルな3DCGキャラクターのようになりますが、V6はほんとに写真ですね…
別のパターンです。
V6 (alpha) の表現力を引き出すことができれば、画像生成AIでは最先端のクリエイティビティと言えるかもしれません(今のところ…)。
特に、アート系の表現で実力を発揮しそうです。
男性の生成は難易度が低いのですが、若い女性がかなり難しい。
V5では、過度に美化されていたのですが、V6 (alpha) は写実的でNatural-lookです。
V5.2で生成すると、以下のようになります。
V6 (alpha) は、V5とは異なり写実的でNatural-look
同じプロンプトをベースにして男性に変更。
余談:
試しに、V6 (alpha) で生成した高品質な画像をRunway Gen-2でビデオ生成してみましたが、やはりビデオの品質も向上しますね。
ビデオ生成については「動画生成AIの可能性」でまとめています。
再生時間:20秒
V5のプロンプトはV6 (alpha)で流用しにくい
V5で肌のディテールを表現する場合、maximal facial detail のような強めのフレーズを使いますが、このプロンプトをV6 (alpha) で流用すると効きすぎてしまいます。
V6 (alpha) では、大幅に品質が向上しているため、同じプロンプトで生成すると以下のようになります。
もし、V5のプロンプトを再利用したいなら、不要なワードやフレーズを削除するか、「--no freckles」等のネガティブプロンプトを指定する必要があります。
Raw TestでV6 (alpha) を探る
流行語のRaw Testです。
Raw Testでは、同じプロンプトで「3回以上」生成して傾向を比較します。
V5.2では大半がマンガスタイルのイメージが生成されます(実写イメージは少ない)が、V6 (alpha) は実写イメージになります(マンガスタイルは少ない)。
Raw Test [ 1 ]
V6 (alpha) では、イラスト表現より写真表現が多く生成されます。
Raw Test [ 2 ]
Raw Test [ 3 ]
写真表現の比較になると、V6 (alpha) はRaw過ぎて、扱いが難しくなっています。V5.2では制御しやすかったので、この領域の再学習は時間がかかりそうです。
Aesthetic TestでV6 (alpha) を探る
流行語のAesthetic Testです。
Aesthetic Testは、前回もやっていますので、確認のみ。
MidjourneyはデフォルトでAesthetic systemが効いていますので、単語だけでテストしていきます。
Aesthetic Test [ 1 ]
Aesthetic Test [ 2 ]
Aesthetic Test [ 3 ]
前回確認したとおり、V6 (alpha)では(イラスト表現より)写真表現が主となり、創造性は低下します。
※V6 (alpha) の創造性は、--style raw でAesthetic systemを軽減し、--s 10 ~ 1000 で調整。
来週、V6の最初のアップデートが実施されるようです
生成画像の一貫性など大きな変更が予想されるので、今のV6では、頑張らない方がいいかもしれませんね…
中断して、アップデート待ちます
「Midjourney高精細画像の研究」マガジンをフォローしておくと、最近記事・最新情報の通知が届きます。
更新日:2023年12月26日(火)/公開日:2023年12月26日(火)
この記事が気に入ったらサポートをしてみませんか?