Midjourney V6とV5はまったく別のもの! 大半のプロンプトは共有できない - Blog 2023/12/21
Midjourney Model V6 (alpha) が利用可能になったので、試してみました。
さすがに(今後、仕様が変更される可能性がある)アルファバージョンの検証はできないので、ファーストインプレッションのみ書き留めておきたいと思います。
Midjourney Model V6 (alpha)
これはアルファテストです。仕様は予告なく変更される可能性があります。
アルファバージョンでのプロンプトの試行錯誤は資産にならない可能性があります。
V5よりも処理に時間がかかり、GPUを消費します(Relax modeはサポートしています)。
V6でのプロンプティングはV5とは大きく異なります。
プロンプトエンジニアリングを「再学習」する必要があります。
V6はプロンプトに対する忠実度が大幅に向上しています。
高画質効果を狙った「award winning, photorealistic, 4k, 8k」のような不要な表現は避けてください。
Midjourneyからのアナウンス(Discord )
Please note
This is an alpha test. Things will change frequently and without notice.
DO NOT rely on this exact model being available in the future. It will significantly change as we take V6 to full release.
Speed, Image quality, coherence, prompt following, and text accuracy should improve over the next few weeks
V6 is slower / more expensive vs V5, but will get faster as we optimize. Relax mode is supported! (it's about 1 gpu/min per imagine and 2 gpu/min per upscale)
Style and prompting for V6
Prompting with V6 is significantly different than V5. You will need to 'relearn' how to prompt.
V6 is MUCH more sensitive to your prompt. Avoid 'junk' like "award winning, photorealistic, 4k, 8k"
Be explicit about what you want. It may be less vibey but if you are explicit it's now MUCH better at understanding you.
If you want something more photographic / less opinionated / more literal you should probably default to using --style raw
Lower values of --stylize (default 100) may have better prompt understanding while higher values (up to 1000) may have better aesthetics
V5とV6のアルファバージョンを比較するのは時期尚早ですが、現在どこまで調整できているかを確認する目的で見ていきましょう。
※同じプロンプトで比較(Model V6 (alpha)では「--v 6」を付加)
品質向上は間違いありません。特に写真表現は素晴らしい。
ただ、V5のプロンプトを使うと、肌のディテールが強すぎる(空間周波数が高すぎる)等、V6の表現力を引き出すことができません。
V6の完全版(full release)になってから、V6に最適化されたプロンプトエンジニアリングを試行錯誤する必要がありそうです。
…ということで、
V5とV6のアルファバージョンを比較するのはあまり意味がないと思いますが、どのくらい品質が向上したのか確認できますので、数パターン試してみたいと思います。
Sample 1
Sample 2
Sample 3
Sample 4
Sample 5
Sample 6
Sample 7
Sample 8
Sample 9
Sample 10
Sample 11
Sample 12
コミュニティガイドラインがより厳しくなる
V6は写真と区別できないレベルに進化していますので、V5で問題なく使用できたワードやフレーズがブロックされる可能性が高そうです。
Adobe FireflyやDALL·E 3では、プロンプトの一部がブロックされたことがあると思います。
不適切な画像を生成しないように、ガイドラインを厳しくするのはやむを得ない処置ですが、表現の幅を狭めることにもなりますので悩ましい問題です(アメリカ大統領選挙もあり、Midjourneyもフェイク画像との闘いが始まります)。
Midjourneyからのアナウンス(Discord )
Community Standards:
This model can generate much more realistic imagery than anything we've released before.
We’ve turned up the moderation systems, and will be enforcing our community standards with increased strictness and rigor. Don't be a jerk or create images to cause drama.
V6が完全版(full release)になったら、Adobe Stockなどで大量に販売されるでしょうね。もう、写真と区別できない…
※Adobe Stockの場合、生成画像のページにAIのマークが付加され、写真ではない生成画像であることが明示されます。
追記:
その後、さらに試してみました。
Midjourneyのアナウンスどおり、V6で意図したイメージを生成するプロンプトを新たに創り出さないといけません。
「V5.2の気に入った生成画像を、V6で生成し直すとさらに良くなる」と期待している人が多いと思いますが、まったく別のイメージになってしまうので、最初から「V6用」のプロンプトを考えていく必要があります。
V6のためのプロンプトエンジニアリングを一から探っていくことになるので、しばらくは、V5.2と併用することになりそうです。
再生時間:35秒
この記事の続き:
「Midjourney高精細画像の研究」マガジンをフォローしておくと、最近記事・最新情報の通知が届きます。
更新日:2023年12月23日(土)/公開日:2023年12月23日(土)