
続:初心に戻って、GenAI"Midjourney"で生成する画像のクオリティアップを試みる
続:"Midjourney"で生成される画像をもっとCOOLにしたい!
昨日の夜遅くに書いていた記事の続きを進めたいと思う。
今ぼくは"Midjourney"で、何をしているのか?
はい、上記リンク先の記事を読んでもらえれば話は早いんだけれど、最近惰性でやってしまっているGenAI"Midjourney"での画像生成ワークと、それに付随するプロンプトエンジニアリングを、初心に戻って改めて見直し、現在ぼくが生成し得る最高のアウトプットを目指そうじゃないか!という試みである。
再びになるが、これまでのあらすじは、上記リンク先で把握していただきたい、大したことしてないけど、興味があればね。
第三段階:コンクリート打ちっぱなしのミニマルな部屋の床に魔法陣を描く
さて、昨晩ゆっくり眠ったので、しっかりと目を覚ますために、早朝から昨日の続きの作業を再開することに。
昨晩は、クオリティアップした女性のポートレートに、背景を付加してゆくというところまで進んでいる。追加したのは、まず単純なコンクリートの壁の部屋。結果として、女性のクオリティの破綻や崩壊はほとんど見受けられず順調な様子。このまま、最終目的地に向けて歩いてゆこうと思うけれど、あまり猛ダッシュすると大きな確率で女性のヴィジュアルが低下する可能性があるので、まずは部屋の中に他の要素を付加してゆこう。
第三段階:1回目 - 部屋の床の魔法陣
「悪魔召喚」といえば、みんな大好き「魔法陣」(Magic circle)。
余談になるが、悪魔召喚と魔法陣について少し触れよう。とはいえ、残念ながらぼくはいままで悪魔召喚の儀式を実際に行ったことがないので、正直いってそのディテールに対して有するヴィジュアル的な知識は、漫画やアニメ
や映画の領域を出ない。
ティーブレイクで「悪魔召喚」の話
というわけで、ネット上で検索をかけてもいいのだけれど、せっかくGenAIに関する記事を書いているので、生成型人工知能チャットボットに聞いてみようかと思う。このnoteに以前書いた記事で以下のようなものがある。
"ChatGPT"に聞こうかとも思ったが、ChatGPTだと、とてもまともな答えが返ってきて、内容として突っ込みどころがなくなりそうなので、引き続きGoogle"Gemini"に聞いてみよう。
悪魔召喚と魔法陣について、Geminiに聞いてみたところ、
結論から言うと、魔法陣は悪魔召喚に必ずしも必須ではありません。
なにっ・・・、まあ薄々それは知っていたけれど、引導を渡されたな。
つまり、前述のように、漫画やアニメ、映画などで、悪魔召喚といえば魔法陣を使うというイメージが強いが、これはあくまで視覚的に分かりやすく表現するための象徴的な要素のひとつであり、歴史的な文献や様々な魔術体系をみると、魔法陣を使わない召喚方法も数多く存在する、ということ。
よし、魔法陣のバージョンも生成するが、それ以外の表現も試みてみよう!これこそ初心に戻ったクオリティアップに違いない。
ではお茶の時間は終わりにして、本筋に戻ります。
改めて、第三段階:1回目 - 部屋の床の魔法陣
うむ、やはり、魔法陣という異質な要素を付加することで、若干女性のクオリティーキープが難しくなってくる。確率にもよるが、アップさせた女性単体のクオリティは下がってしまう。その中でもなんとかチョイスした。





手法として、"--ar"を1:1のSquareや、9:16の縦長のPortraitにしたほうが、女性のクオリティを多少キープできるような気がする。それをEditで16:9のサイズに編集生成。最初から16:9を出そうとすると、女性と魔法陣との距離感の関係性が崩れるケースが多発する。さらにいうと、「床に描かれた魔法陣」を求めているのだけれど、壁、あるいは女性の着ているジャージに魔法陣が刻印されてしまうケースも、これは縦横比にかかわらず発生する。それはそれで、いい意味の想定外としてヴィジュアルとしてはCoolなものも生成されている。
魔法陣の場所に関しては、おそらくだが、女性のクオリティをキープするためのプロンプトが、女性の顔のアップ重視につながるため、部屋の床とのアングル調整がかなり困難なのだと予測する。
これは、カメラのアングル指定をプロンプトにいれていないこともあるのかな。
ブラッシュアップしてゆこう。
第三段階:2回目 - 部屋の床の魔法陣 - プロンプト簡素化、魔法陣の光、カメラアングル
問題点を検討、女性のクオリティ低下への対応調整とアングル追加、以下の点が問題なのではないかという推測を立てて微調整する。
プロンプトに要素を詰め込みすぎていて情報量が多すぎる
魔法陣が強く光り輝くことで女性へのクオリティ配分が削られる可能性
カメラアングル調整



なぜかポケットに手を突っ込みがち。指先のハルシネーションは抑えられるので、ポジティブに捉えよう。あるいは、Midjourneyがハルシネーションを意識しての結果か!
微調整後の結果、先ほどの縦横比でいうと、1:1のSquareにはまったく魔法陣が入らなくなった。「魔法陣の光を抑えて地味にする」というプロンプトに調整したためか、魔法陣があまり重要なものではなくなったようだ・・・。
それは困る、いま魔法陣は最優先事項なのだ。でもあまり魔法陣に固執しすぎると、女性が蔑ろにされてしまう。この調整がたぶん難しい。ちなみに相変わらず16:9比率での生成もよろしくない。今回は、9:16の縦長のPortraitをEditしているケースがほとんどである。だから、バストアップではなく、体の腰上、膝上くらいまであるのは、とても好ましい。Editで伸ばせばなんとかなると思いがちだが、なんとかならないのである。ハルシネーションの嵐が巻き起こり、大抵は「スレンダーマン」(The Slender Man)みたいになるから。
本来は、最初から全身を生成したい。ただし全身を他の要素と複合的に生成すると、圧倒的に女性のヴィジュアルのクオリティーは下がってしまうのだ。以下のようにね、今回慎重にやってるから、まあまだマシに出来てるけど。
そしてやはり、ポケットに手を突っ込みがち。そんな要素をプロンプトに入れた覚えはない。

さて調整後の肝だが、女性のクオリティ、改善されているような・・・き、も、す、る、が。そして引き続き、魔法陣が床に刻印されているケースが少ないと言えば、少ない。
あとレアケースで、女性の胸元に魔法陣が刻印されるケースあり。それはそれでDemonicでいいけどさ。ただしその場合には、肌の露出度が跳ね上がる、考えれば当たり前だが・・・、最悪、上半身裸になっちゃう。それはちょっと方向性がずれるので、却下。

このくらいで、よしとして、次のステップに進もう。
第四段階:女性に魔術書を持たせて詠唱させる
いよいよ佳境に入ってまいりました。
正直、「悪魔召喚」という目的地に関して言えば、悪魔は実際に召喚されてなくてもいいというのが、ぼくの目的地になってます。つまり、魔法陣の前で魔術書を持った女性が悪魔を呼び出すために詠唱していて、魔法陣が光り輝きだす、というヴィジュアルが欲しいのです。
なぜなら、女性のヴィジュアルクオリティと悪魔のヴィジュアルクオリティと同時に維持して生成するのは、たぶん今の性能のMidjourneyでは無理なんじゃないのかな・・・。別々に生成して、Photoshopで合成したほうが圧倒的に効率的だし、まともなものが完成すると思う。
いや、勢いとして、試みとして、悪魔召喚!まで行くつもりだけどさ。
では進めよう。
第四段階:1回目 - 魔術書を持った女性が魔法陣の前で呪文を詠唱している。
まず魔術書を「手で持って開いている」というアクションに対して、ハルシネーション炸裂。そこがクリアできれば、女性のクオリティに関しては、ギリギリのラインで表現できている。魔術書に「Goetia」と表記させてみたが、ちょっとポップになりすぎる。本だけではなく、みんなGoetiaって文字がデザインされたジャージをコーディネイトしはじめちゃって・・・、まあこれはこれでおもしろいけれど。






立っているバージョンと、胡座をかいているバージョンのプロンプトを試してみたのだけれど、立っていると魔法陣がほとんど見えないケースが多い。そして、「胡坐をかく」ことに対しても足首あたりにハルシネーション炸裂、予想はしていたが・・・。
この段階はこの程度で見切りをつけて、次に進もう。
次は、ついに悪魔召喚直前、魔法陣が光出しますぜ、だんな。
でも記事が長くなっちゃたから、次回につづくよ。