見出し画像

Nijijourney V6alpha ver出たのでV5と比較してみた。

Niji V6とV5の比較

2024年1月30日
ついにNijijourneyもV6モデルアルファバージョンが開始しました!
この記事のバナーも「わーい」という文字含めてV6で作ってます!
今回は過去のプロンプトなどを使ってどのようにV6が進化しているか比較してみます!!!
※全て同じseed値での検証です。
※画像のキャプションは使用したプロンプトです。


食べ物:ピザ

Niji V5:ピザを食べている女性↓

cute anime girl with turquoise hair eating pizza on yellow background, in the style of anime aesthetic, clean and simple designs --seed 39 --niji 5

Niji 6:ピザを食べている女性↓

cute anime girl with turquoise hair eating pizza on yellow background, in the style of anime aesthetic, clean and simple designs --seed 39 --niji 6

ぱっと見変わらないけど、よく見るとV6はピザの形がちゃんと三角形になってたり、美味しそうに見えますね!

あと黄色い背景を指定したらV5は服も黄色になったり影響受けてましたが、V6はちゃんと背景だけが黄色。きっとちゃんと色を分けて指定しやすくなっているっぽい。(→後半の "人物の書き分け" 参照)

食べ物:ラーメン

Niji V5:ラーメンを食べる女性↓

ラーメンを食べるピンクの髪のかわいいアニメの女の子、アニメの美学のスタイル、クリーンでシンプルなデザイン、黄金比、シンセウェーブ、食堂の背景 --seed 1 --niji 5

Niji V6:ラーメンを食べる女性↓

ラーメンを食べるピンクの髪のかわいいアニメの女の子、アニメの美学のスタイル、クリーンでシンプルなデザイン、黄金比、シンセウェーブ、食堂の背景 --seed 1 --niji 6

ラーメンも同じシード値で比較してますが、絵柄が違いますね。
V5はザ食堂風の背景ですが、V6はプロンプト通りSynthwaveテイストの食堂の背景となっています。
V6は文法ルールが変わっていることがわかりますね。

※シンセウェイヴ は、1980年代の映画音楽やビデオゲームに影響された電子音楽のジャンル。

ラーメンの形も現実的なサイズ、描写になっていて、食べている口元もいい感じになりました。
しかし、手元と箸はまだおかしいことがあるようですね。。

プロンプトの解析方法【マイナー技術?】

ここでプロンプトの解析方法について語ります。
必要なければ次項目まで飛ばしてください。

プロンプトはそれぞれの単語に"重みづけ" されて画像が生成されます。
※「::2,」とか付けて重みを増やしたりして細かく調節できるますので、知らない方は「Midjourney プロンプトウェイト」などで調べてみてください。
実はこの単語の重みについて "/Shorten コマンド" で簡単に調べることができて便利です。
上記ラーメンのプロンプトは日本語ですが、nijijourneyでは英語に翻訳されて実行されているため、生成画像に封筒絵文字の "✉️" (envelopeと打つと出てくる)を付けることで実際の英語プロンプトがわかります。

生成画像に封筒でリアクションをつけると・・・
niji・journey botから使用された英語プロンプト(と4分割された画像)が届きます。

botから届いた英語プロンプトの単語をコピーして、 /Shortenコマンドを使ってみます。
プロンプトを短くするための、取消線で、消しても問題ない単語を教えてくれます。

5つの短いプロンプトを提案してくれる Shortenコマンド

1番下の Show Details ボタンを押します。
すると、各単語の重みを教えてくれます。

pinkとcafeteriaの要素が強い

カッコの中身の数字がそれぞれの単語の重みです。
単語ごとの数字比率で結果が変わりますので、
A::0.1, B::0.2

A::5, B::10
は同じ結果になるはずです。

上記結果を見ると、「ピンク(0.98)」と「カフェテリア(1.00)」の要素が強くて、ついで「ラーメン(0.56)」「シンセウェイブ(0.48)」と「アニメ(0.16)+(0.03)」と続きます。
確かにそんな感じのイラストですよね。

「この画像はこの比率でできてるんだなー」とざっくり把握しておくと、単語の順番の重要性が理解できて、今後画像生成する時参考になります。
※ちなみに(0.00)の単語を消しても生成結果は変わっていくので、重みゼロでも全く意味がない単語というわけではなさそうです。(乱数調整みたいな感じ?)

日本語プロンプトの「食堂の背景」が「cafeteria background」と訳されていましたので、「食堂の背景」を「カフェテリアの背景」として生成してみた結果、先ほどと全く同じ画像が生成されました。

ラーメンを食べるピンクの髪のかわいいアニメの女の子、アニメの美学のスタイル、クリーンでシンプルなデザイン、黄金比、シンセウェーブ、カフェテリアの背景 --seed 1 --niji 6

日本語プロンプトは自分の思っている意味とは異なる翻訳になっている可能性がありそうですので、日本語プロンプトには注意が必要なのです。

ピースサインポーズ

過去のプロンプトをseed固定して(スタイルも外して)比較してみます。

Niji V5:レトロメイドのピースサイン↓

70s retro anime drawing featuring a maid girl thighs the peace sign, in the style of animated gifs, kuromicore, simple line work, dynamic and screen printing flat colors, vibrant academia, blue and pink, around Heart, 病み、吸い込まれる鮮やかな瞳の輝き, Applecore, dollcore, close-up extraordinary smiles --s 88 --seed 1 --niji 5

Niji V6::レトロメイドのピースサイン↓

70s retro anime drawing featuring a maid girl thighs the peace sign, in the style of animated gifs, kuromicore, simple line work, dynamic and screen printing flat colors, vibrant academia, blue and pink, around Heart, 病み、吸い込まれる鮮やかな瞳の輝き, Applecore, dollcore, close-up extraordinary smiles --s 88 --seed 1 --niji 6

ピースサインのポーズは問題なさそう。
「simple line work」って入ってるけど書き込みが増えてる。
ローアングルが増えてるのは「dynamic」のせい?
どっちもかわいいけど、いろいろ調節が必要です。

次は短い単語なので変化がわかりやすいかも

獣人化

Niji V5:ジャングルコアのパンサー↓

Anthro furry panther, Junglecore --seed 1 --niji 5

Niji V6:ジャングルコアのパンサー↓

Anthro furry panther, Junglecore --seed 1 --niji 6

「Anthro」はanthropomorphの略。 英語のスラングで、擬人化、獣人化、または獣人そのものを指します
「furry」は毛皮で覆われたって意味です。
この2つの単語を使うだけでケモナー用画像生成が捗ります。

V5は暗かったけど、V6は明るく鮮やかな背景色ですね。V6はデフォルトで明るいカラーになりやすい気がします。

被りもの

Niji V5:紙袋をかぶる↓

頭に紙袋をかぶる、紙袋の頭、学生、顔の隠れた少女 --seed 1 --niji 5

Niji V6:紙袋をかぶる↓

頭に紙袋をかぶる、紙袋の頭、学生、顔の隠れた少女 --seed 1 --niji 6

色指定はなかったのでV5では白系のカラーだったのが、V6は明るい色がついています。
紙袋も前よりうまく被れるようになりましたね。

次は話題の "文字入れ" を試してみます。

文字を書く:英語

Niji V5:Amazonの箱入りおじさん↓

"amazon"のロゴが書かれたダンボール箱、箱の中から猫耳のおじさんが顔を覗かせている。鳥瞰図 --seed 1 --niji 5

Niji V6:Amazonの箱入りおじさん↓

"amazon"のロゴが書かれたダンボール箱、箱の中から猫耳のおじさんが顔を覗かせている。鳥瞰図 --seed 1 --niji 6

概ねAmazonのロゴを書くことができました!!!
しかし、学習データになかったのでしょうか ”猫耳のおじさん”が反映されていないですね。

英単語は書いてくれますが、日本語はまだ苦手なようです。
おでこに"肉"と書くのは何度やっても失敗します。。

筋肉質のアニメキャラ、おでこに "肉" と文字が書かれている、顔の正面 --seed 1 --niji 6

文字を書く:ひらがな

Niji V5:いただきます↓

ご飯を食べる子供、"いただきます!" と吹き出しの中に書かれている --seed 999 --niji 5

Niji V6:いただきます↓

ご飯を食べる子供、"いただきます!" と吹き出しの中に書かれている --seed 999 --niji 6

ひらがなでも「いただきます!」と言えました。
というか言い間違ってても子供のイラストなので可愛いですね!!!

人物の書き分け

ここが1番すごい改善ポイントです。

Niji V5:男女の食事風景の書き分け↓

2人が笑顔で食事している、ブロンドヘアの女性は笑顔でステーキを食べている、黒髪の男性は小さなプリンを食べている、イタリアンレストランの背景、男性は黒いスーツを着ている、女性は赤いドレスを着ている。 --seed 1 --niji 5

Niji V6:男女の食事風景の書き分け↓

2人が笑顔で食事している、ブロンドヘアの女性は笑顔でステーキを食べている、黒髪の男性は小さなプリンを食べている、イタリアンレストランの背景、男性は黒いスーツを着ている、女性は赤いドレスを着ている。 --seed 1 --niji 6

人物の書き分けができるようになったのは凄いです!!!
V5では服装が混ざったり、色が混ざったり、人物が増えたりしますが、V6は記述方法である程度コントロールが可能になりました。
Midjourney V6の時に話題になっていた記述方法と同じですね。

ダイナミック

Niji V5:カンフーの達人↓

カンフーの達人、ダイナミックな面白いポーズ、ソロ、カリカチュア、クローズアップ --seed 1 --niji 5

Niji V6:カンフーの達人↓

カンフーの達人、ダイナミックな面白いポーズ、ソロ、カリカチュア、クローズアップ --seed 1 --niji 6

元々そうですが、さらに少しリアルになって遠近感がつきましたね。
ダイナミックにしたい気持ちをより反映してくれました。

ポップアート

Niji V5:ポップ+歪んだグロテスク↓

薄紅色の舌を出した恋をしている女性、ポップで小さなハート、スマイルコア、シンプルでかわいい、ラフ・エッジ、歪んだグロテスクのスタイル、カラーハーフトーン --seed 1 --niji 5

Niji V6:ポップ+歪んだグロテスク↓

薄紅色の舌を出した恋をしている女性、ポップで小さなハート、スマイルコア、シンプルでかわいい、ラフ・エッジ、歪んだグロテスクのスタイル、カラーハーフトーン --seed 1 --niji 6

グロすぎる画像ばかり生成されたのでマイルドな優しいプロンプトに修正。
V6はやはりカラフルでより詳細なテイストになりやすい気がします。
ポップアートな感じに仕上がりました。

Niji V6 公式開発ログ 〜具体的な特徴の紹介

最初に言うべきでしたが、公式の開発ログではV6の具体的な特徴が記されておりました。

特徴1:V6では”長いプロンプト”がお勧め。

Niji V6 を最大限に活用するために、長めのプロンプトを書くことをお勧めします。

niji・journey dev logs

より詳しく状況説明している長いプロンプトの方が内容を理解してくれます。存在しない概念でも、詳細説明することで描いてくれます。

特徴2:テキストが書ける

上記でも書いたように、引用符「””」で囲うことで画像に文字を入れることが可能になりました。
漢字や日本語はまだ苦手のようですが、ひらがなはある程度書けるようになっていました。

特徴3:細かいディティールに対応

・左右で瞳の色が違うキャラを描ける
・腕が複数本あるようなキャラクターが描ける
・2人の異なる特徴を持つキャラクターを同時に描ける
など、
繊細な描けるものが増えております。

Nijijourney V6のフルバージョンのリリースは約1ヶ月以内とのことです。
2月中に公開されるのかな?
楽しみですね!

V6参考生成画像

最後に、いくつかV6の生成イラストを紹介します。
いろいろテイストを変えてます。
※プロンプトは最後に有料で記載してます。

喜びと赤い花
赤と黒と白のゴシックスタイル
手書きの猫耳ボブ
花と儚い少女
チャンピオンと汗
燃えるような赤い髪の女性の城
暗い部屋で絶望
猫耳のサムライ
プールで抱き合う
教会の修道女

終わりです。

参考画像を生成したプロンプトは全て下記の有料部分で紹介してます。
本日この記事書くのに画像生成枚数1100枚以上作ってたので、疲れました……購入で応援してくれたら嬉しいです!

プロンプトはぜひアレンジして自由に使ってみてください!

ここから先は

2,176字 / 11画像

¥ 500

この記事が気に入ったらチップで応援してみませんか?