Midjourneyで近未来のサッカースタジアムを作ってみた
今流行りのAIツール。話題のChatGPTを始め、2023年になって爆発的な進化が訪れた感がありますが、その中でも、自然言語でプロンプト(指令)を与えるとAIが画像を生成してくれるMidjouneyが最高に面白い!!
Midjourneyの使い方やTipsを説明しているものはたくさんあるので、こちらではMidjouneyで画像を生成した時の言葉の選び方や、実際のプロンプトを見ながら、指示によってどう画像が変化していったのかを書きたいと思います
画像のテーマは「未来のスタジアムで、大型ディスプレイを見上げるサッカー選手」
※ 僕は、情景を考えて英語でプロンプトを書いています。Midjourneyは日本語でも理解してくれますが、(想像するに)学習データの基礎は英語で作られていると思うので、英語の方が生成される画像のバリエーションも増えるのではないか、と思います。あと、日本語だとイラストが生成されることが、体感的には多かったです。わからない言葉はDeepL先生で。
まずは、土台となる「サッカー選手」を作ります。
prompt: a photo of a man playing soccer
初めに「a photo of」と入れたのは、Midjouneyがイラスト調の絵を生成する場合もあるからです。今回は写真レベルの画像を作ります。
次に、1人ではなくチームでサッカーをしている画像を土台にしたいので、試合の意味がある「game」と「together with his team」を加えます。また、入れたくない要素を指示するためのネガティブプロンプトを、文末に「—no ~〜」(ハイフン2つ、no、スペース、〜〜)を使って入力します。モノクロの写真はいらないので「--no monochrome photo」を追加します。
prompt: a photo of a man playing soccer game together with his team --no monochrome photo
今度は「未来の」「サッカースタジアム」という要素を加えます。サッカーという単語を何度も使っていますが、Midjourneyを使い倒すコツとして、単語の直前の形容詞などが生成される画像に大きく影響するので、文章として意味が伝わる内容ではなく「しつこいくらいに明確に、わかりやすく」言葉を選ぶことが大切です。
また、先に生成した画像がイラスト調になってしまいました。「--no monochrome photo」の写真の部分が「no photo」=写真なし、とAIに理解された可能性があるので「color」に変更します。
prompt: a photo of a man playing soccer game together with his team. they are on the field of the soccer stadium. --no monochrome color
次に、サッカースタジアムの「未来感」を増すために、「futuristic」と「futuristic angular holographic LED display」(長方形の未来的なLEDディスプレイ)を追加します。
prompt: a photo of a man playing soccer game together with his team. they are on the field of the soccer stadium. the stadium is futuristic. there is a futuristic angular holographic LED display. --no monochrome color
ホログラフ調のディスプレイが登場して、だいぶ、未来感がただよってきました!! 蜂の巣のような網目柄が、Midjourneyが考える「未来的要素」なんですね。
次に、LEDディスプレイを「観客席の上」over head of the audience seatsに持ってきて、そこには「サッカープレイヤー」が写っている指示を出します。
prompt: a photo of a man playing soccer game together with his team. they are on the field of the soccer stadium. the stadium is futuristic. there is a futuristic angular holographic LED display. the display is over head of the audience seats. there are two soccer players appeared on the display.—no monochrome color
お、惜しい、、、右下のイメージで、ディスプレイの解像度が左上くらいに上がったら今回は完成です。あとは、同じプロンプトで精度を高めつつ、細かい指示でハマるのを見つけます。それっぽく言うとこれもチューニングの1つでしょうか。
プロンプトを出すとすると、「サッカーボールのオブジェ」はなくして、ディスプレイの映像をもっと高解像度にします。
prompt: a photo of a man playing soccer game together with his team. they are on the field of the soccer stadium.
the stadium is futuristic. there is a futuristic angular holographic LED display. the display is over head of the audience seats. there are two soccer players appeared on the display. the resolution of the display is high as 4k quality. —no monochrome color
結果的に、このプロンプトをほとんど変えず、何度もリロールをやり直したり、以前の画像を戻したりして下の結果までアップデートできました。あともう少し、イラストっぽさがなくなるといいのですが、細かい描写が加わる画像はこの辺が今の限界のような気がします。みなさんも試してみてください。
※「--ar 〜〜」を加えるとアスペクト比を指定できます。
※ 最終的な色味やサッカープレイヤーの数は気にしないでください笑
prompt: a perfect shading of close-up photo of a man playing soccer game together with his team. they are on the field of the soccer stadium. the stadium is futuristic. there is a futuristic angular holographic::1.2. LED display. the display is over head of the audience seats. there are two soccer players appeared on the display. the resolution of the display is high as 8K quality. insanely detailed --ar 16:9 —no monochrome color
Midjourneyは、他のAI同様、爆速で進化しているので、現在のversion 5もあっという間に進化することが明白です。今のうちにプロンプトを使って、新しいクリエイティブなスキルを身につけたいと思います。
ストックフォトで画像やイラストを探している時間が、AIで欲しい画像を生成する時間に取って代わるのも、遠い話ではないですね!!
余談:ChatGPTが書いたストーリーに沿って、KT3045年に突如設立された皇帝が君臨する悪の帝国 Yuranesya を倒すために、遥か彼方の荒野に集結した聖なる騎士 Sacred WarriorsたちをNFT化して販売しています。どういう話に展開するのか全くわかりませんが応援よろしくお願いします。
Blades of the Futre: Portraits of the Sacred Warrior
https://opensea.io/collection/blades-of-the-future-portraits-of-the-sacred-warri