Midjourneyの解説です。
公開日:2023年3月27日
※動画を再生してから、インタビューを読むのがオススメです。
Midjourneyバージョン5とChatGPT-4を一緒にして、それらが持つ偉大な力を利用するつもりです。
そして、より良いプロンプトを作り、この新しい技術を最大限に活用します。
ChatGPT-4は、長年修行を積んできた賢者のようなものだと想像できます。
その魔法使いのもとへ行き、さまざまな文脈に対応した明確で具体的なプロンプトを定義してもらうことができるのです。
親愛なる魔法使い様、チーズを題材にした私の映画の主人公に、甘い女性のプロンプトをお願いできますか?
もちろんだ、若きパダワンよ。
ただ、最後に8kと入れてください。
このプロセスを実行するために、ChatGPT-4にプロンプトの書き方をトレーニングし、そのアウトプットを洗練させるお手伝いをします。
その後、このプロンプトがMidjourneyでどのように出力されるかを見て、プロンプト作成ウィザードを改善する方法を探します。
では、さっそく始めてみましょう。
最初のステップは、ChatGPTにアクセスすることです。
モデルをChatGPT-4に設定し、新しい会話を開始します。
そして、ChatGPT-4をプロンプト作成ウィザードとして使用するように設定します。
そのために、プロンプトエンジニアとして行動する必要があることを通知します。
MidjourneyというAIアートジェネレーターのプロンプトを書くんだ。
私はあなたに短いコンテンツのアイデアを提供し、あなたの仕事は、それを完全で明確で首尾一貫したプロンプトに練り上げることです。
ここで、私はタスクを定義した。
何をするのか、その内容を伝えました。
そして今、AIアートジェネレーターとは何か、プロンプトとは何か、どのような形式で回答してほしいか、といった文脈を与えています。
プロンプトは、画像の内容やスタイルを説明するものです。
大衆文化、芸術家、メディアへの言及を明示することが有効です。
名詞と形容詞に焦点を当てる必要があります。
これは、ChatGPTが、秋の初日を思い起こさせるような、誰かの空虚な視線を花言葉のように表現してしまうのを防ぐためです。
そして、ChatGPTには、それがどのようなものかを実際に定義するよう求めています。
目が遠くにあるものに集中している、むしろ虚ろな視線を送っているのです。
私はこのプロンプトを、Midjourneyに魔法をかけるようなものだと考えるのが好きです。
そして、適切な言葉の組み合わせで、無限の可能性を引き出すことができるのです。
ガーディアム・ミッドジャーニー・オ・サー」!
そして、「プロンプトの例をあげます」と伝えます。
使用すべきカメラを正確に定義してください。
カメラのレンズは、私たちが求めている正確な美学を定義するのに役立つので、それが使用するメディアであれば、正確なカメラのレンズを得ることができます。
私は次に、ここに公式がありますと言います。
括弧、コンテンツ、ここに名詞を挿入する。
媒体、ここに芸術的媒体を挿入する。
スタイル、ここにジャンル、アーティスト、大衆文化への言及を挿入する。
ライティング、ここにライティングを参照する。
Colours(カラー):カラースタイルやパレットを参照する。
構図:カメラ、特定のレンズ、ショットタイプ、位置的な要素について言及します。
このように、プロンプトを特定の変数に分解することで、効果的なプロンプトのさまざまな構成要素に関連する形容詞を得ることができるのです。
こうすることで、プロンプトのあらゆる可能性に対して、正確な表現ができるようになるのです。
プロンプトを出すときは、括弧を外し、自然な言葉で、より具体的に話してください。
正確で明瞭な言葉を使う。
常にプロンプトの選択肢を2つフルで出力してください。
これは、プロンプトを求めるたびに2つの選択肢を得ることを意味します。
これは、Mid Journeyの中で同時にさまざまな画像を作成するのに適しています。
また、どちらか一方を選んだり、両方の一部を組み合わせて独自のプロンプトを作成したりと、より柔軟な対応が可能です。
最後に、どのような出力にしたいかをイメージするために、プロンプトの例を1つ挙げておきます。
ChatGPTを最大限に活用するためには、多くの文脈情報を与えることが重要です。
ChatGPT-4では、最大25,000文字までの文脈情報を受け取れるようになりました。
これにより、より多くの情報を与えることができ、それを独自のインテリジェンスに含めることができるようになりました。
最近見た面白い使用例では、あるコーディング言語の新機能を取り上げ、そのドキュメント全体をChatGPT-4に入力し、初心者を対象としたチュートリアルを吐き出すように依頼しました。
つまり、高度で複雑な言語を、よりわかりやすく出力してくれるようChatGPTにお願いしているのです。
では、最初のプロンプトでChatGPTから出力された内容を見てみましょう。
最初の1枚は、J.M.W.ターナー、偉大なターナーとH.R.ガイガーに触発された静かな海中の風景中油絵のスタイルです。
ターナーはイギリスの画家で、特に油絵具を使い、非常に美しい雰囲気のある海景を描いた人ですね。
さて、最初に気づいたのは、やはり括弧が含まれていたことです。
そこで、ChatGPTを再教育して、プロンプトを括弧なしで書き換えてもらうことにします。
でも、括弧は答えになりませんよ、若造。
私の方が詳しいんですよ、魔法使いさん。
よし、これでだいぶ良くなってきたぞ。
このプロンプトをコピーして、Midjourneyに飛び込んでみましょう。
アルゴリズムのバージョン5を使用していることを確認し、フォワードスラッシュimagineと入力し、新しいプロンプトを貼り付けるのです。
すると、驚くようなものが出てきます。
同時に、2つ目のアイデアを実行することも可能です。
さて、これらはChatGPTから聞いたアイデアです。
しかし、自分の意志で何かをさせることもできるのです。
例えば、アルプスのヴィンテージポスターをChatGPTにお願いしてみることにします。
このリクエストにどう応えてくれるのか見てみましょう。
そして、Midjourneyに戻り、私たちの最初のリクエストにどう対応しているか見てみましょう。
最初のリクエストは、J.M.W.ターナー作の静謐な水中都市景観の油絵で、エーテルのような暖かい夕日が水面を透かしているものでしたね。
色はリッチなブルー、ティール、ウォームオレンジで、広角レンズでシーンを撮影してください。
すると、かなり面白いコンセプトピースができあがった。
この中から2枚ほどアップスケールしてみましょう。
水中と街並みの対比が素晴らしいですね。
そして、2つ目のプロンプトは、ロボットと人が入り乱れる近未来的なガーデンパーティです。
これはアルフォンソ・ミュッシャのスタイルで、彼はとても人気のあるアーティストなので真似してみました。
彼はアールデコ調のスタイルで、20世紀初頭に多くの様式広告を制作しています。
また、彼の名前の発音については、ご容赦ください。
いつもブッチしていると思いますが、念のため、アルフォンソ・ムッシャ、アルフォンソ・ムッシャは、イギリスのアルフォンソ・ムッシャです。
そして、興味があれば、アメリカのアルフォンソ・ムッシャ。
さて、余談はこのくらいにして。
アルフォンソ・ムッシャのロボットガーデンパーティーに戻り、この中から2つほどアップスケールして詳しく見てみましょう。
アルフォンソ・ムッシャのスタイルで、ロボットパーティという非常に特徴的で興味深いコンセプトがあることがおわかりいただけると思います。
気に入ったのですが、実際にお願いしたプロンプトを試してみましょう。
では、今度はヴィンテージの旅行ポスターを見てみましょう。
また、アスペクト比を変えて、縦長にしようと思っています。
つまり、ポスターを出力することになります。
つまり、ポスターのような出力になります。
では、2つ目の選択肢をもう一度考えてみましょう。
そして、2×3の比率でもう一度試してみてください。
その間に、チャットGBTの中に別のものを入れてみます。
今回はニューヨークのストリートフォトのポートレイトです。
Midjourneyのバージョン5では、AIアートのレベルやクオリティが格段に上がりました。
具体的には、フォトリアリズムが非常に向上しています。
人体構造の細かい部分のディテールが精密になり、AIアートと本物の写真を見分けるのが難しくなってきました。
Midjourneyの中で特によく描かれているのは、髪の毛です。
僕くらいの年齢になったら、髪の毛の感触を見せてあげるよ、君。
すごい。
そして、Midjourneyの外側にある美しいヴィンテージスタイルのポスターを見てください。
絶対に魅了される。
これ、家のインテリアにしたらすごくいいんじゃないでしょうか。
もしビジネスアイデアに興味があるなら、さまざまな場所の非常に特殊な旅行ポスターを作り、賃貸物件の数が多い特定の場所をターゲットにしたEtsyショップを開くことを提案できます。
なぜなら、Airbnbの借り手は、その空間に関連する具体的にインスピレーションを与えるアート作品を壁に貼るのが大好きだからです。
このような作品をマネタイズする絶好のチャンスだと思うんです。
わあ、すごい。
見てください、この作品。
惚れ惚れします。
色も構図も素晴らしいです。
2つのオプションの違いは、1つ目は明るい赤で彩度が高く、2つ目はパステルカラーでよりニュアンスのあるアプローチになっているのがとても気に入っています。
さて、Midjourneyの内部では、テキストがかなりひどい状態でレンダリングされていることにお気づきでしょうか。
これはバージョン5でもあまり改善されていない点です。
ひとつだけ、可能な限り不要なテキストを削除しようとしていることが紹介されました。
そして、それが実現し、多くの場所で表示されるテキストが少なくなったという考え方もあります。
しかし、私たちにできることは、このような画像を使い、実際にテキストを追加することで、自分自身を目立たせることです。
Figmaのような無料のツールを使えば、簡単に独自のテキストを追加できます。
画像を簡単に貼り付けることができます。
ここでは、Fキーで枠を描いて画像を切り抜き、その枠の中に画像を貼り付けます。
そして、画像を上に伸ばして、上部にテキストを入力するためのスペースを確保します。
自分たちで書いた文章を入れるんだ。
ここでは、Chamonixを試してみます。
適当なフォントを選びます。
今回はピンを選んでみます。
フォントサイズを160まで大きくします。
フォントスタイルを太字に変更します。
そして、アートワークの内側から色を選択します。
1行の中に単語全体が入るようにします。
そして、文字間隔を少し広げます。
オールキャップを使うときは、文字間隔を少し広げることが重要です。
そこで私のChamonixのスペルを確認してください。
そして、私は正しいのです。
なんてこった、失読症って最悪だ。
AIに感謝だ。
しかし、スペルが下手なことをすべて失読症のせいにするべきではありません。
画像に独自のテキストを追加することで、そのクオリティを大幅に向上させることができます。
これは、AIがまだ苦労している点です。
手や銃の問題は克服しているのに、テキストはまだ苦手としているというのは、非常に興味深いことです。
もうひとつ、V5がまだ対応できていないのが、特定の要素を作り、それを記憶しておいて、将来の作品に反映させるということです。
例えば、キャラクターを作った後、同じキャラクターを将来的に再利用することができます。
オブジェクトやロケーションも同様です。
でもそれは、そう遠くないうちに実現されることを期待しています。
しかし、これはMidjourneyとChatGPTで作成した私のビンテージ旅行風ポスターです。
でもって、ストリートフォトの方はどうなっているのか、ちょっと見てみましょう。
うわー、これは美しい。
本当に魅惑的です。
でも、ChatGPTに自分のアイデアを出す機会を与えることもできるんです。
そこで、写実的なもの2つと、美しい女性のもの1つを含む、5つのさまざまなアイデアを出してもらうことにしました。
そして、ChatGPTが作りたかった作品を見てみることにします。
AIは何を欲しているのか?
熱気球のシーン。
わぁ、素敵なフランスの田園風景。
そして美女には、伝統的な装いの日本女性が描かれています。
興味深いのは、ChatGPTには、最も可能性の高い狭い範囲の出力ではなく、非常に多様な出力を与えるというバイアスが内蔵されていることです。
そして、素晴らしいストリートシーンが出来上がりました。
ChatGPTさん、アートへの貢献、ありがとうございます。
私はMidjourneyのコミュニティフィードをスクロールして、人々が何を思いつくか見るのが好きです。
そして、生成されるイメージの少なくとも半分は、魅力的な女性の周りに基づいていると言わなければならないでしょう。
私は魅力的な女性が大好きなので、とてもうれしいです。
ChatGPTに、なぜ魅力的な女性をモチーフにしたアートが多いのか、その意見を聞くこともできます。
ChatGPTは、AIが生成するアートに魅力的な若い女性が多いのは、AI自体のバイアスとユーザーの好みの両方を反映した、いくつかの要因に起因していると述べています。
私たちはこれに対処すべきでしょうか?
私は必要ないと思います。
美女を選んで作ることに問題があるとは思いませんが、そういうことがあるのは事実です。
どちらかというと、私は、一方では魅力的な若い女性を見て楽しんでいるのですが、それはほとんど儚い楽しみのように思えるのが非常に興味深いところです。
ポルノを見るようなもので、楽しいけれども、とても空虚なんです。
もっと深くて、もっとニュアンスがあって、もっと美しいものが、他の場所にあると思うんです。
創造性は、ツールを独創的な方法で組み合わせることから生まれます。ChatGPTとMidjourneyの長所を使うことで、高度なアーティキュレートプロンプトを作ることができるのです。
私のAIコースは以下の説明でご確認ください。また、AIの現状については、次にこのビデオをご覧ください。