![見出し画像](https://assets.st-note.com/production/uploads/images/129268472/rectangle_large_type_2_6b6d5c653e55077b29d2e124810a85d7.png?width=1200)
Nijijourney V6alpha ver出たのでV5と比較してみた。
Niji V6とV5の比較
2024年1月30日
ついにNijijourneyもV6モデルアルファバージョンが開始しました!
この記事のバナーも「わーい」という文字含めてV6で作ってます!
今回は過去のプロンプトなどを使ってどのようにV6が進化しているか比較してみます!!!
※全て同じseed値での検証です。
※画像のキャプションは使用したプロンプトです。
食べ物:ピザ
Niji V5:ピザを食べている女性↓
![](https://assets.st-note.com/img/1706585828363-JG9oALdihz.png?width=1200)
Niji 6:ピザを食べている女性↓
![](https://assets.st-note.com/img/1706585780442-1FPuqAmodf.png?width=1200)
ぱっと見変わらないけど、よく見るとV6はピザの形がちゃんと三角形になってたり、美味しそうに見えますね!
あと黄色い背景を指定したらV5は服も黄色になったり影響受けてましたが、V6はちゃんと背景だけが黄色。きっとちゃんと色を分けて指定しやすくなっているっぽい。(→後半の "人物の書き分け" 参照)
食べ物:ラーメン
Niji V5:ラーメンを食べる女性↓
![](https://assets.st-note.com/img/1706594153902-8OI8EfIOJH.png?width=1200)
Niji V6:ラーメンを食べる女性↓
![](https://assets.st-note.com/img/1706594161435-Yvx3FUllCf.png?width=1200)
ラーメンも同じシード値で比較してますが、絵柄が違いますね。
V5はザ食堂風の背景ですが、V6はプロンプト通りSynthwaveテイストの食堂の背景となっています。
V6は文法ルールが変わっていることがわかりますね。
※シンセウェイヴ は、1980年代の映画音楽やビデオゲームに影響された電子音楽のジャンル。
ラーメンの形も現実的なサイズ、描写になっていて、食べている口元もいい感じになりました。
しかし、手元と箸はまだおかしいことがあるようですね。。
プロンプトの解析方法【マイナー技術?】
ここでプロンプトの解析方法について語ります。
必要なければ次項目まで飛ばしてください。
プロンプトはそれぞれの単語に"重みづけ" されて画像が生成されます。
※「::2,」とか付けて重みを増やしたりして細かく調節できるますので、知らない方は「Midjourney プロンプトウェイト」などで調べてみてください。
実はこの単語の重みについて "/Shorten コマンド" で簡単に調べることができて便利です。
上記ラーメンのプロンプトは日本語ですが、nijijourneyでは英語に翻訳されて実行されているため、生成画像に封筒絵文字の "✉️" (envelopeと打つと出てくる)を付けることで実際の英語プロンプトがわかります。
![](https://assets.st-note.com/img/1706595716116-hwpg61tkpI.png?width=1200)
![](https://assets.st-note.com/img/1706595719681-25Bb4xzm5g.png?width=1200)
botから届いた英語プロンプトの単語をコピーして、 /Shortenコマンドを使ってみます。
プロンプトを短くするための、取消線で、消しても問題ない単語を教えてくれます。
![](https://assets.st-note.com/img/1706596091569-XCc8ghbJ94.png?width=1200)
1番下の Show Details ボタンを押します。
すると、各単語の重みを教えてくれます。
![](https://assets.st-note.com/img/1706596171536-owjVLlC7Ww.png?width=1200)
カッコの中身の数字がそれぞれの単語の重みです。
単語ごとの数字比率で結果が変わりますので、
A::0.1, B::0.2
と
A::5, B::10
は同じ結果になるはずです。
上記結果を見ると、「ピンク(0.98)」と「カフェテリア(1.00)」の要素が強くて、ついで「ラーメン(0.56)」「シンセウェイブ(0.48)」と「アニメ(0.16)+(0.03)」と続きます。
確かにそんな感じのイラストですよね。
「この画像はこの比率でできてるんだなー」とざっくり把握しておくと、単語の順番の重要性が理解できて、今後画像生成する時参考になります。
※ちなみに(0.00)の単語を消しても生成結果は変わっていくので、重みゼロでも全く意味がない単語というわけではなさそうです。(乱数調整みたいな感じ?)
日本語プロンプトの「食堂の背景」が「cafeteria background」と訳されていましたので、「食堂の背景」を「カフェテリアの背景」として生成してみた結果、先ほどと全く同じ画像が生成されました。
↓
![](https://assets.st-note.com/img/1706604343511-QfLxlLnci5.png?width=1200)
日本語プロンプトは自分の思っている意味とは異なる翻訳になっている可能性がありそうですので、日本語プロンプトには注意が必要なのです。
ピースサインポーズ
過去のプロンプトをseed固定して(スタイルも外して)比較してみます。
Niji V5:レトロメイドのピースサイン↓
![](https://assets.st-note.com/img/1706597509947-EQKiH8Jq18.png?width=1200)
Niji V6::レトロメイドのピースサイン↓
![](https://assets.st-note.com/img/1706597575008-hlN1l6DD9S.png?width=1200)
ピースサインのポーズは問題なさそう。
「simple line work」って入ってるけど書き込みが増えてる。
ローアングルが増えてるのは「dynamic」のせい?
どっちもかわいいけど、いろいろ調節が必要です。
次は短い単語なので変化がわかりやすいかも
獣人化
Niji V5:ジャングルコアのパンサー↓
![](https://assets.st-note.com/img/1706598060155-Fk0nwfPzc3.png?width=1200)
Niji V6:ジャングルコアのパンサー↓
![](https://assets.st-note.com/img/1706598073229-SrN2qT67ya.png?width=1200)
「Anthro」はanthropomorphの略。 英語のスラングで、擬人化、獣人化、または獣人そのものを指します。
「furry」は毛皮で覆われたって意味です。
この2つの単語を使うだけでケモナー用画像生成が捗ります。
V5は暗かったけど、V6は明るく鮮やかな背景色ですね。V6はデフォルトで明るいカラーになりやすい気がします。
被りもの
Niji V5:紙袋をかぶる↓
![](https://assets.st-note.com/img/1706598863331-PbfE9L1uLp.png?width=1200)
Niji V6:紙袋をかぶる↓
![](https://assets.st-note.com/img/1706598925940-3YQxdgmzPQ.png?width=1200)
色指定はなかったのでV5では白系のカラーだったのが、V6は明るい色がついています。
紙袋も前よりうまく被れるようになりましたね。
次は話題の "文字入れ" を試してみます。
文字を書く:英語
Niji V5:Amazonの箱入りおじさん↓
![](https://assets.st-note.com/img/1706600134541-0Nk5IvfCgw.png?width=1200)
Niji V6:Amazonの箱入りおじさん↓
![](https://assets.st-note.com/img/1706599869130-9yp31hZ6vF.png?width=1200)
概ねAmazonのロゴを書くことができました!!!
しかし、学習データになかったのでしょうか ”猫耳のおじさん”が反映されていないですね。
英単語は書いてくれますが、日本語はまだ苦手なようです。
おでこに"肉"と書くのは何度やっても失敗します。。
![](https://assets.st-note.com/img/1706600489560-EK7hRhH3W6.png?width=1200)
文字を書く:ひらがな
Niji V5:いただきます↓
![](https://assets.st-note.com/img/1706602742255-pZIEfVEf2q.png?width=1200)
Niji V6:いただきます↓
![](https://assets.st-note.com/img/1706602643011-fEWsd4iK2D.png?width=1200)
ひらがなでも「いただきます!」と言えました。
というか言い間違ってても子供のイラストなので可愛いですね!!!
人物の書き分け
ここが1番すごい改善ポイントです。
Niji V5:男女の食事風景の書き分け↓
![](https://assets.st-note.com/img/1706601509739-X6taeW84Oz.png?width=1200)
Niji V6:男女の食事風景の書き分け↓
![](https://assets.st-note.com/img/1706601569181-dEL5weWiTc.png?width=1200)
人物の書き分けができるようになったのは凄いです!!!
V5では服装が混ざったり、色が混ざったり、人物が増えたりしますが、V6は記述方法である程度コントロールが可能になりました。
Midjourney V6の時に話題になっていた記述方法と同じですね。
ダイナミック
Niji V5:カンフーの達人↓
![](https://assets.st-note.com/img/1706601013086-OeOtgXQOTl.png?width=1200)
Niji V6:カンフーの達人↓
![](https://assets.st-note.com/img/1706601038570-loF255W8p2.png?width=1200)
元々そうですが、さらに少しリアルになって遠近感がつきましたね。
ダイナミックにしたい気持ちをより反映してくれました。
ポップアート
Niji V5:ポップ+歪んだグロテスク↓
![](https://assets.st-note.com/img/1706603125541-U4IM2xvUoW.png?width=1200)
Niji V6:ポップ+歪んだグロテスク↓
![](https://assets.st-note.com/img/1706603108556-7Hn71qKBXg.png?width=1200)
グロすぎる画像ばかり生成されたのでマイルドな優しいプロンプトに修正。
V6はやはりカラフルでより詳細なテイストになりやすい気がします。
ポップアートな感じに仕上がりました。
Niji V6 公式開発ログ 〜具体的な特徴の紹介
最初に言うべきでしたが、公式の開発ログではV6の具体的な特徴が記されておりました。
特徴1:V6では”長いプロンプト”がお勧め。
Niji V6 を最大限に活用するために、長めのプロンプトを書くことをお勧めします。
より詳しく状況説明している長いプロンプトの方が内容を理解してくれます。存在しない概念でも、詳細説明することで描いてくれます。
特徴2:テキストが書ける
上記でも書いたように、引用符「””」で囲うことで画像に文字を入れることが可能になりました。
漢字や日本語はまだ苦手のようですが、ひらがなはある程度書けるようになっていました。
特徴3:細かいディティールに対応
・左右で瞳の色が違うキャラを描ける
・腕が複数本あるようなキャラクターが描ける
・2人の異なる特徴を持つキャラクターを同時に描ける
など、
繊細な描けるものが増えております。
Nijijourney V6のフルバージョンのリリースは約1ヶ月以内とのことです。
2月中に公開されるのかな?
楽しみですね!
V6参考生成画像
最後に、いくつかV6の生成イラストを紹介します。
いろいろテイストを変えてます。
※プロンプトは最後に有料で記載してます。
![](https://assets.st-note.com/img/1706608421163-gVyPtj3RiR.png?width=1200)
![](https://assets.st-note.com/img/1706614308441-Y9gSjwjh16.png?width=1200)
![](https://assets.st-note.com/img/1706633332906-S8baQaTBnM.png?width=1200)
![](https://assets.st-note.com/img/1706614459409-ZdAG3okNr1.png?width=1200)
![](https://assets.st-note.com/img/1706614588462-Z7c4lqYzvq.png?width=1200)
![](https://assets.st-note.com/img/1706617744130-CDhgCvCMn1.png?width=1200)
![](https://assets.st-note.com/img/1706617885208-ZtxuoBZUdE.png?width=1200)
![](https://assets.st-note.com/img/1706617918455-ApZ3VwylLW.png?width=1200)
![](https://assets.st-note.com/img/1706632573563-uxG34DhTNg.png?width=1200)
![](https://assets.st-note.com/img/1706633173306-TpXMqhJi3E.png?width=1200)
終わりです。
参考画像を生成したプロンプトは全て下記の有料部分で紹介してます。
本日この記事書くのに画像生成枚数1100枚以上作ってたので、疲れました……購入で応援してくれたら嬉しいです!
プロンプトはぜひアレンジして自由に使ってみてください!
↓
ここから先は
¥ 500
この記事が気に入ったらチップで応援してみませんか?