AI画像生成ツール「Midjourney」のコツと言語的考察

2022年8月3日 19:20

Midjourney初心者「自分も他の人が作っているような綺麗な画像を生成したい！」→「え...全然上手くいかない...どうやってるの？」

こういった光景をTwitterや掲示板でよく見る。まだまだ未熟ながら自分が使っている中で気が付いたメソッド・コツを備忘録としてまとめる(※全文無料で読めます/随時加筆)　

パワーワードを学ぶ

Midjourneyにはpromptの後にとりあえず入れておけば上手くいきやすい、綺麗になりやすいといういくつかのパワーワードが存在する。おそらくAIが認識しやすく、学習素材も大量にある要素が結果的にパワーワードになっているのだと思う。

いくつか挙げると
【画像の仕上がりを綺麗・リアルにしたい場合】
・Unreal Engine
・Octane Render
・Realistic,photorealistic
・16k,8k,4k
・cinematic
・Photorealism
・実際にあるカメラ名

【コンセプトアートっぽくしたい場合】
・artgerm
・trending on artstation
・art print
・character concept

【人物系】
・portrait(顔メインにしたい場合)
・full body(人の全身を映したい場合)
・～hair(long hair,short hair,blonde hair,black hairなど長さ、色指定)
・～skin(brown skinなど肌色指定、tanned skin→日焼けなど指定)

【アニメ・可愛い系】
・kawaii(ポップで2次元っぽくなる)
・anime(anime girlとかで2次元っぽくなる)
・Cute(可愛く)
・Pixiv(造形の安定化)

【調整ワード】
・hyper quality(とにかくすげえクオリティで頼む！)
・ highly detailed(とにかく細部まで描け！)
・ dof(ピントを調整したい場合)
・intricate design(複雑なデザイン)
・wide angle(視野角広めにしたい場合)
・～ perspective(gopro perspectiveとか、視野角の調整)
・cinematic lighting(強めの光を入れたい場合)
・soft lighting(弱めの光を入れたい場合)
・color ～(物体の色を指定したい場合)
・colorful(発色を良くする)
・desaturated(色褪せた感じに)
・elaborate(緻密・精巧になりやすい)
・black and white(白黒にしたい場合)
・symmetrical(物体を左右対称にしたい場合、物体が崩れてしまう時に使うと綺麗になりやすい、ただしオリジナリティの高い物体にはなりづらい)
・～ atmosphere(dark atmosphereとかbeautiful atmosphereとかdivine atmosphereとか画像の全体的な雰囲気作りを調整)
・atmospheric(趣深い感じ、雰囲気出てる感じに)
・manga,comic(漫画っぽく、線画っぽくなる)
・weird(不気味、気味悪い感じ)
・blur(ぼかしたりしたい場合)
・brush stroke(強い筆感出したい場合)
・soft focus(フォーカスをゆるめに)

【その他ワード】
・tarot card(絵のタッチがタロットっぽくなり見栄えする)
・sci-fi(SFっぽく)
・steampunked(スチームパンク)
・cyberpunked(サイバーパンク)
・Mecha,Mech(メカ)

【有名クリエイター】
例えば自分の好きな画家や漫画家、映画監督などがいる場合、だいたいそういった名前を突っ込んでおくとそれっぽくなる。

【有名ゲーム】
世界的なゲームのタイトルを入れるのも雰囲気が出て上手くいく、ゼルダの伝説(legend of Zelda)、マリオ(super mario)、ポケモン(pokemon)、ダークソウル(dark souls)など。

この他にも大量にあるがよく使われているのはこの辺り。まだまだコミュニティ内でも研究段階でもっといい調整ワードがあるはずなので、試行錯誤が必要。

Prompt作成支援ツール

有志が作ったPrompt作成の支援ツール「Midjourney Prompt Helper by netlify」「Midjourney Prompt Helper by noonshot」を使ってみよう。よく使われる有名ワードを網羅しつつ、様々なジャンルのワードをワンタッチで選択・コピペできるようになっている。また関数も簡単に調整できるので非常に使いやすい。

例:「未来のスナイパーライフル」

Sniper gun of the Future , blue Cherry blossoms in the background,details realistic,concept art,divine, details manga style, dark night,photorealistic,elegant,cinematic,FHD,colorful,4k

関数を使いこなそう

promptの後に関数(パラメーター)を追加するとより高度に生成画像を調整できるようになる。公式サイトの方で細かくまとめられているので気になる人は是非。英語だが翻訳でもなんとなく理解できる。ただし別に必須ではなく、逆に関数が足枷になる場合もあるので注意。

【便利な関数一覧】
・--quality
→画像の品質と生成時間を調整する。デフォルト値は1。0.25、0.5、1.0、2.0、5.0と指定できる。とりあえず高くしておけばOK。5を設定すると画像のクオリティは高いのだが生成時間が長いので注意。

・--ar
→画像の比率指定。デフォルトは1:1になっている。16:9とか1:2とか自分の好きな比率にしよう。比率は非常に大切で、同じpromptでも横長か縦長かで結果が大きく変わる場合もあるので、色々なパターンを試した方がいい。prompt的に横長のが上手くいきやすいとか逆に微妙になるといった場合がある。

・ --stylize
→説明が非常に難しい。この数値を高くするとより独創的になっていくが、自分の指定したpromptからは離れていく。逆に低くすると芸術性が下がる。簡単に言えばパルプンテ的な感じなのでとりあえずstylizeを高くしてみて上手くいったらラッキーと考えるといい。使いこなせるとなんでもできるようになるので結構大事。とりあえず触ってみて感覚を掴むといいと思う。
デフォルト値は2500で625～60000まで指定可能。60000にすると要素が消滅したり、ぐちゃぐちゃになったり訳が分からなくなるが結果上手くいくこともある。公式は芸術を爆発させたい場合に使うと説明している。

・--chaos
→画像がカオスになる。promptからは外れやすいが、画像の雰囲気を大きく変えてくれる。stylizeと違うのはstylizeは多少promptを考慮してくれるがchaosは画像の変化量が大きいイメージ。ただstylizeと使い時は一緒で画像の生成結果があまり好みじゃないときに使ってみよう。値は0～100まで指定可能。

・--seed
→同じ画像の差分を作りたい場合に使える。ほとんど同じだけどちょっとだけ違う画像を作りたい時におすすめ。特にアニメーションや動画に活かしたい人は使えるのではないだろうか。画像のseed値を読み取ってからseed関数に数値を入力する。

例：--seedの使い方

生成された画像にdiscord上でメールマーク(:envelope:)のリアクションをする。そうすると下記画像のようにseed値が生成されるので、同じpromptを入力し関数--seed 24791を入力して画像を生成しよう。そうするとほとんど同じ画像を生成することができる。

・--iw
→参考画像を入れた場合にどのくらいその画像を重要視するかを調整する。たまに使う。デフォルト値は0.25で1.0まで指定できる。ちなみに参考画像の入れ方は「/imagine prompt: http://myimageonline.jpg A forest spirit at night」みたいな感じでpromptの前に画像URLを突っ込む。

・::
→promptの言葉の後に::を付けることで言葉の比重の度合いを調整する。デフォルト値は1.0。
例えば　/imagine hot dog::1.5 food::-1
dogが1.5、foodが-1となり、「dog」がちょっと比重高めになり、「food」が比重低めになる。この要素を入れたいけれどあまり主張したくないとか、この要素を強く出したい！という時に使える。promptに関する質問等はここを参照。

例:「羽の生えた妖精ウサギ」

fairy winged rabit::1.5 in beautiful rain::-1.0,art print,clean brush stroke,unreal engine,hyper quality,trending on artstation,high focus,high realistic,artgerm,character concept, --stylize 60000 --quality 2 --ar 2:3

Midjourney テストモードについて(※追記)

※Betaモードは停止中でしたが、新たにtestモードとして復活しました！

8月23日に実装されたMidjourney betaモードでは今まで苦手だった二次絵や人物造形、写真風、エッチといった要素が劇的に改善され非常に豊富な画像を生成できるようになった。使っている感じオープンソース化されたStable Diffusionのモデルが利用されていると思われます。結果的にMidjourneyと差別化されていた要素を埋め合わせてしまう形になりました。

ベータモードへの移行方法は簡単で/settings　コマンドを入力し　設定画面を開いたら「MJ version3」から「MJ Test」へ切り替えます。これで設定は終わりです。テストモードでは生成時間が長いので注意しましょう。
「MJ Test Photo」はよりリアルな写真のような画像を作りたい場合に選択しましょう。

けしからんAIだなぁ…。

詳しくは下記を参考にしてください↓

Community Feedから学ぶ

公式サイトではCommunity Feedといってコミュニティ内で人気の高い作品とそのpromptを見ることができる。初めたての人はここに載っている好きなテイストの作品を見つけてどういったワードが使わているのかを見たり、ちょっとpromptを真似して試してみるのも勉強になる。
謎にpromptを隠したり、それを有料コンテンツ化する人がいるが結局すべて見れる上に、コミュニティの成長にも繋がらないのでやめた方がいい。

自分が作った作品がCommunity Feedにちらほら載るようになってくると嬉しいし、だいぶ使いこなせていると言える(Community Feedでは縦長画像が人気)

より具体的な状況を指定した方がいい

「divine insane temple at night,white architecture,beautiful mysterious atmosphere,a girl standing at distance,full moon in the distance,cherry blossom in the distance」

あまり自分の思った通りの画像や構図ができない場合、Midjourneyに問題があるというよりは文章的な欠陥があったり、構想者の想像が甘い場合が多い。AI任せでランダムに良いのをできるのを待つのでもいいが、より具体的な状況を考えて、それを言葉として指定してやった方が抽象度が低く、一枚の画像として上手くいきやすい。

promptの最適化と順番

基本的には無駄な言葉が入るほど指向性が薄れ一辺倒な画像しか生成されなくなってくる。要素は少なければ少ないほど、画像の生成レンジが広がりそれだけ上振れ(神画像)を引く可能性も上がるので、できるだけpromptを最適化できないかを考えておこう。また同promptでも言葉の順番を入れ替えるだけで変化する場合もあるため、その辺りも念頭に置いておくといい。

最終的にはガチャになりがち

たいしたpromptでなくてもソシャゲのガチャと同じようにSSR級が急に爆誕する場合もあるし、いいpromptでも全然上手くいかないこともある。
回数は高クオリティな作品を作りたい場合とても大きな武器なので、たくさん遊びたい、仕事に活かしたいという人はサブスクの無制限プランに入ることをおすすめする。

最後に

Midjourneyの台頭によって「AIが仕事を奪う」といった意見が散見されるがそうした態度そのものがこの先の未来を暗くしているということを自覚した方がいい。AIにとって代わられるのであれば我々は別のクリエイティブに力を注げばいいだけの話だ。人の持つ表現という光は形を変えるだけであって、本質そのものは変わらない。AIに希望を見出すか、絶望を見出すかは私たち次第であり、これまでの歴史が示してきたように「絵を描く」という意味や意義も刻一刻と変化し続けてきた。今は新たな時代の過渡期というだけである。

この記事に載っている情報も決して正解というわけではない。それぞれが自由にMidjourneyと対話しながら自分なりの方法論を見つけていってほしい。その体験そのものが"創作"である。