
Midjourney:プロンプトの基本:前編
画像生成AIの一種であるMidjourney(以下MJ)に、欲しいイメージを描いてもらうには、その思いを、基本的には「言葉」で伝えます。その言葉のまとまりを「プロンプト」と言います。
1.プロンプトは英単語やフレーズの羅列でもいい
MJのプロンプトは、文章にする必要はありません。単語、フレーズの羅列で構いません。単語、およびフレーズは、【red, dress, blue sky, …. 】のように、単語の後に、コンマ+スペースを入れ、次の単語、もしくはフレーズを続けます。
ちなみにプロンプト「Prompt」の語源は下記の通りです。
「promptness(即座性)」(句中の in prompte において)という意味で、15世紀初頭にラテン語の promptus(prompt(動詞)を参照)から派生しました。1590年代には、「ヒント、提案された情報、促しの行為」という意味が生まれました。コンピューターの文脈では、「コンピューターからのメッセージで、ユーザーが応答するために必要または支援する」という意味が1977年に生まれました。
補足:ピリオドで区切った文章も可。大文字は認識せず、絵文字は認識します。2024年現在、MJのプロンプトは英語に限られています。
2.プロンプトは「トークン」に分解されている
人の手で書かれたプロンプトは、MJはどのように理解しているのでしょうか?
MJ公式のドキュメントから、下記を引用します。
プロンプトは、Midjourney ボットが画像を生成するために解釈する短いテキスト フレーズです。Midjourney ボットは、プロンプト内の単語やフレーズをトークンと呼ばれる小さな部分に分割します。トークンはトレーニング データと比較され、画像の生成に使用されます。適切に作成されたプロンプトは、ユニークで刺激的な画像を作成するのに役立ちます。
これが、ちゃんとした文章ではなく、単語やフレーズの羅列でいい理由です。書かれたプロンプトは「細切れ(トークン)」にされてから、A Iが解析し、それを元にイメージを描き出します。
3.プロンプトを分析するコマンド/shorten
では、トークンはAIによってどのように理解されているのでしょうか。MJには、それを知る手掛かりとなる/shortenというコマンドがDiscordにあります。以下のプロンプトを、/shortenで分析してみましょう。
knolling flowers, pastel colors, minimalist, peachy Wes Anderson colors, flatlay photography, hyperrealistic photography --v 5.2

道具や日用品などを、平行や直角に並べて整理する手法
このプロンプトをそのまま、「/shorten」に続けて、入力(コピペ)します。

実行しますと、すぐに分析結果が返ってきます。

オレンジの枠で囲まれた太文字になっているいるところが、AIによって、重要と認識されたワードになります。逆に横線で引かれている部分は、AIによってそれ無くてもよくね?と言われている部分です。
続いて、下段の詳細を見る(Show Details)ボタンを押してみましょう。
重要度が数値化、グラフ化され、不要な言葉を提示してくれます。

MJがちゃんと表現してくれないな?と感じたときは、/shortenコマンドを使って、自分が書いたプロンプトを分析してみましょう。きっとこのコマンドが役に立つ場面は多いと思います。
4.まとめ
プロンプトは、単語やフレーズの羅列でおっけい
プロンプトは、より細かいトークンに分解されている。
/shortenコマンドで、プロンプトを分析してみよう。
この記事で一番伝えたかったのは、「/shortenコマンド」の使い方です。
注:本著「Midjourneyの教科書」は、Midjourney使用者を対象に書いています。また、記事公開後に、加筆修正、あるいは記事そのものを削除することもよくあります。あらかじめご了承ください。