
続々:初心に戻って、GenAI"Midjourney"で生成する画像のクオリティアップを試みる
"Midjourney"で生成する「悪魔召喚」シーンへの道は、まだまだ続く。
当初はひとつの記事で、そして短時間でサクッと終わらせようと思って始めたこの試みも、ついに3記事目に突入してしまった。
前回、そして前々回の詳細に関しては以下に詳しいので、もし興味があれば読んでみて欲しい。まあ大したことは書いてないけど、いまぼくがこの記事でいったい何を目指して歩いているのか、それくらいは、わかるかもしれない。
まあ簡潔に言うと、最近惰性でこなしていた"Midjourney"における生成ワークとプロンプトエンジニアリングを、初心に戻って考え直そう!という試みであり、その題材に選んだのが「悪魔召喚」シーンというわけ。
では先を急ごう。
第四段階:2回目 - 魔術書を持った女性が魔法陣の前で呪文を詠唱している。
ほんとうは、もう次のステップに進もうと思ったのだが、もう少しブラッシュアップすることにした。ちなみに次のステップとは、「召喚成功、魔法陣が唸り、光、悪魔が出てきちゃう」シーン。
微調整項目としては、
女性のディテール強化
要素のバランス調整
カメラのアングルと焦点の見直し
ざっくりこんな感じである。
ちなみに、魔法陣は、最初光る前(光っていない魔法陣)で生成していたけれど、少し進めて、もう光らせてしまった。つまり、ほぼほぼ最終段階になるかな。加えて、胡座のハルシネーションを回避するために、女性を椅子に座らせるバージョンも用意してみたが・・・。椅子じゃなくて座り方を変えたほうがいいという結果。椅子はシチュエーションとしてもヴィジュアルとしてもおかしいので、却下。なんか、ぼっちキャンプみたいなヴィジュアルになってしまったので。
まあいずれにせよ、調整がかなり難しいし、女性のクオリティキープと悪魔召喚という混沌の融合、難しいなあ・・・。なんか調整を入れすぎて、全体のクオリティも下がってるような気がしてきた。よくわからなくなってきたぞ。





あっ、無駄な要素を省いて女性のディテールをあげようとしたら、部屋の中がかなりクリーンになってしまったのか。ひとつ前のバージョンの方が、廃墟感があった。だから、ぼくが思っているクオリティーから遠ざかっているように感じるんだな、きっと。
第四段階:3回目 - 魔術書を持った女性が魔法陣の前で呪文を詠唱している。
いったん頭をリセットしつつ、プロンプトを解析して、改めてブラッシュアップを試みようと思う。
そのために、第四段階の3回目から離れて、いったん検証タイムとする。
プロンプトが果たして有効なのかどうか疑心暗鬼に陥ったので、パートごとに分断して画像を生成、その結果を見て、プロンプトを再構成する。というわけで、いったんワープ。
「悪魔召喚」プロンプト検証の時間へワープ
この記事を終わらせて、別記事として書こうかとも思ったのだけれど、まだそんなに文字数も進んでいないため、パラレルワールドの体で、少しここで検証を行う。長くなりそうなら、別記事に別タイトルで移行しよう。
性格的に、問題や疑問を放置できないのである。
検証項目は以下。
現在のプロンプト内の要素は本当に有効なのか
長文のプロンプトを輪切りにして単体での生成結果を見る
"--style raw"を解除するという選択肢
Midjourneyのプロンプトにおける要素の有効性
GenAIにおけるプロンプトについて、要素が「詳細な文章での説明」が有効でないケースが多々ある。つまり文章ではなく「単語」のみの方が有効なケース。もちろん、様々なGenAIがあるので、すべてに対して言えることではないが、Midjourneyに関しては、それはある程度当てはまっているのではないだろうか。
かつ、プロンプトがあまり長文になりすぎることと、要素の構成がバラバラに配置されていることが、生成のクオリティーを下げている可能性。
というわけで、現在使用している長文のプロンプトを輪切りにして、要素を単語に分解して生成してみる。加えて、--style rawの有無で分けて生成。






うむ、見極めが難しいが・・・、まずやはり肝は、光っていようがいまいが、魔法陣の存在が、女性のクオリティーを下げている可能性は大いにある。ただ条件として加えるなら、ウエストやヒップより上あるいは全身が生成されている立ち姿の女性の場合、魔法陣という要素にそのクオリティーは大きく影響されるのではないのか。顔が潰れちゃうしね。ちなみに、バストアップおよび胡座などの場合には、立ち姿よりもその影響は軽減される。
ちなみにこの検証のプロンプトには女性のディテール強化に関することは一切入れていない。
"--style raw"のあるなしは、明確にその差が出るケースと、微妙なケースがある。ただやはり個性という意味では、"--style raw"を入れるべきか。なしだと、"Midjourney"仕様の、見たことのある同じような顔になっちゃうと思う。
現在最終版として使っているプロンプトに入っていて、検証には入っていない要素は、
魔法陣
本を手に持って開いて読んでいる
呪文を詠唱している
結論は出ないまま、検証を終えるが、第四段階:1回目と2回目のプロンプト のクオリティー、けっこう高いんだな、きっと。
よし、それをベースにして、一気に先に進んじゃおう(無理矢理)。
ちょっと頭をクールダウンするために、短いけど今回はここまで。