Midjourney V6とV5はまったく別のもの！大半のプロンプトは共有できない - Blog 2023/12/21

2023年12月24日 16:27

Midjourney Model V6 (alpha) が利用可能になったので、試してみました。
さすがに（今後、仕様が変更される可能性がある）アルファバージョンの検証はできないので、ファーストインプレッションのみ書き留めておきたいと思います。

Midjourney Model V6 (alpha)

これはアルファテストです。仕様は予告なく変更される可能性があります。
アルファバージョンでのプロンプトの試行錯誤は資産にならない可能性があります。

V5よりも処理に時間がかかり、GPUを消費します（Relax modeはサポートしています）。

V6でのプロンプティングはV5とは大きく異なります。
プロンプトエンジニアリングを「再学習」する必要があります。

V6はプロンプトに対する忠実度が大幅に向上しています。
高画質効果を狙った「award winning, photorealistic, 4k, 8k」のような不要な表現は避けてください。

Midjourneyからのアナウンス（Discord ）

Please note

This is an alpha test. Things will change frequently and without notice.
DO NOT rely on this exact model being available in the future. It will significantly change as we take V6 to full release.
Speed, Image quality, coherence, prompt following, and text accuracy should improve over the next few weeks
V6 is slower / more expensive vs V5, but will get faster as we optimize. Relax mode is supported! (it's about 1 gpu/min per imagine and 2 gpu/min per upscale)

Style and prompting for V6

Prompting with V6 is significantly different than V5. You will need to 'relearn' how to prompt.
V6 is MUCH more sensitive to your prompt. Avoid 'junk' like "award winning, photorealistic, 4k, 8k"
Be explicit about what you want. It may be less vibey but if you are explicit it's now MUCH better at understanding you.
If you want something more photographic / less opinionated / more literal you should probably default to using --style raw
Lower values of --stylize (default 100) may have better prompt understanding while higher values (up to 1000) may have better aesthetics

V5とV6のアルファバージョンを比較するのは時期尚早ですが、現在どこまで調整できているかを確認する目的で見ていきましょう。
※同じプロンプトで比較（Model V6 (alpha)では「--v 6」を付加）

film still, Street Fashion Photography, Super cute young Japanese woman. --style raw --v 6.0

film still, Harajuku, Tokyo, Street Fashion Photography, Super cute young Japanese woman. --ar 3:4 --style raw --v 6.0

品質向上は間違いありません。特に写真表現は素晴らしい。
ただ、V5のプロンプトを使うと、肌のディテールが強すぎる（空間周波数が高すぎる）等、V6の表現力を引き出すことができません。
V6の完全版（full release）になってから、V6に最適化されたプロンプトエンジニアリングを試行錯誤する必要がありそうです。

…ということで、
V5とV6のアルファバージョンを比較するのはあまり意味がないと思いますが、どのくらい品質が向上したのか確認できますので、数パターン試してみたいと思います。

Sample 1

film still, Harajuku, Tokyo, Street Fashion Photography, Super cute young Japanese woman. --ar 3:4 --v 6.0

V 6 (alpha) の生成結果
V5のプロンプトなので、V6では空間周波数が高すぎる

Sample 2

film still, Korean K-Pop boy group, high brand fashion photography --ar 3:4 --style raw --v 6.0

Sample 3

knolling Colorful crystal gemstones, Wet with water and sparkling reflections, Background is a large amount of gravel like a jewel, top down view, very detailed --ar 16:9 --v 6.0

Sample 4

film still, 2020s, a photorealistic, Japanese girl fashion models for high brands --ar 3:4 --v 6.0

Sample 5

Japanese junior high and high schools --ar 16:9 --style raw --v 6.0

Sample 6

Collection of cartoon animals, minimalist, adventure time, and surrealism --ar 16:9 --v 6.0

Sample 7

coloring page, manga style super cool boys group only lines, empty space --s 500 --v 6.0

Sample 8

3DCG model, colorful, countless building blocks, shiny/glossy, White background --ar 16:9 --v 6.0

Sample 9

VFX effect, Effect of Explosion, radial, collection of materials --ar 16:9 --style raw --v 6.0

Sample 10

black stone wall texture background --ar 16:9 --v 6.0

Sample 11

film still, lion detail, macro, photography --ar 3:4 --v 6.0

Sample 12

Massed Practice, High Humidity, High-end photography for luxury brands, film still, Japanese concept relates, imperfection, natural aging, minimalist, beauty, photography --ar 16:9 --v 6.0

コミュニティガイドラインがより厳しくなる

V6は写真と区別できないレベルに進化していますので、V5で問題なく使用できたワードやフレーズがブロックされる可能性が高そうです。
Adobe FireflyやDALL·E 3では、プロンプトの一部がブロックされたことがあると思います。

私たちはモデレーションシステムを強化し、コミュニティ基準をより厳格かつ徹底的に適用することになります。
We’ve turned up the moderation systems, and will be enforcing our community standards with increased strictness and rigor. Don't be a jerk or create images to cause drama.

https://discord.com/channels/662267976984297473/952771221915840552/1187272332268556298

不適切な画像を生成しないように、ガイドラインを厳しくするのはやむを得ない処置ですが、表現の幅を狭めることにもなりますので悩ましい問題です（アメリカ大統領選挙もあり、Midjourneyもフェイク画像との闘いが始まります）。

Midjourneyからのアナウンス（Discord ）

Community Standards:

This model can generate much more realistic imagery than anything we've released before.
We’ve turned up the moderation systems, and will be enforcing our community standards with increased strictness and rigor. Don't be a jerk or create images to cause drama.

V6が完全版（full release）になったら、Adobe Stockなどで大量に販売されるでしょうね。もう、写真と区別できない…
※Adobe Stockの場合、生成画像のページにAIのマークが付加され、写真ではない生成画像であることが明示されます。

Massed Practice, High Humidity, High-end photography for luxury brands, film still, Japanese concept relates, imperfection, natural aging, minimalist, beauty, photography --ar 16:9 --v 6.0

film still, 2020s, a photorealistic 18 year old , maximal facial detail, life --ar 3:4 --no freckles --v 6.0

film still, 2020s, center view super cute 18 year old Japanese young woman --ar 3:4 --v 6.0

film still, close-up center view Korean K-Pop boy, high brand fashion photography --no freckles --ar 3:4 --style raw --v 6.0

追記：

その後、さらに試してみました。
Midjourneyのアナウンスどおり、V6で意図したイメージを生成するプロンプトを新たに創り出さないといけません。
「V5.2の気に入った生成画像を、V6で生成し直すとさらに良くなる」と期待している人が多いと思いますが、まったく別のイメージになってしまうので、最初から「V6用」のプロンプトを考えていく必要があります。

V6のためのプロンプトエンジニアリングを一から探っていくことになるので、しばらくは、V5.2と併用することになりそうです。

film still, close-up center view super cute 18 year old Japanese young woman --ar 3:4 --style raw --no freckles --v 6.0

再生時間：35秒

この記事の続き：

Midjourney V6(alpha)のための新しいプロンプトエンジニアリング探求の準備 - Blog 2023/12/21

「Midjourney高精細画像の研究」マガジンをフォローしておくと、最近記事・最新情報の通知が届きます。

「Midjourney高精細画像の研究」

更新日：2023年12月23日（土）／公開日：2023年12月23日（土）

Midjourney V6とV5はまったく別のもの！ 大半のプロンプトは共有できない - Blog 2023/12/21