見出し画像

Midjourney:プロンプトの基本:前編

画像生成AIの一種であるMidjourney(以下MJ)に、欲しいイメージを描いてもらうには、その思いを、基本的には「言葉」で伝えます。その言葉のまとまりを「プロンプト」と言います。

1.プロンプトは英単語やフレーズの羅列でもいい

MJのプロンプトは、文章にする必要はありません単語、フレーズの羅列で構いません。単語、およびフレーズは、【red, dress, blue sky, …. 】のように、単語の後に、コンマ+スペースを入れ、次の単語、もしくはフレーズを続けます。

ちなみにプロンプト「Prompt」の語源は下記の通りです。

「promptness(即座性)」(句中の in prompte において)という意味で、15世紀初頭にラテン語の promptus(prompt(動詞)を参照)から派生しました。1590年代には、「ヒント、提案された情報、促しの行為」という意味が生まれました。コンピューターの文脈では、「コンピューターからのメッセージで、ユーザーが応答するために必要または支援する」という意味が1977年に生まれました。

https://www.etymonline.com/jp/word/prompt

補足:ピリオドで区切った文章も可。大文字は認識せず、絵文字は認識します。2024年現在、MJのプロンプトは英語に限られています。

2.プロンプトは「トークン」に分解されている

人の手で書かれたプロンプトは、MJはどのように理解しているのでしょうか?
MJ公式のドキュメントから、下記を引用します。

プロンプトは、Midjourney ボットが画像を生成するために解釈する短いテキスト フレーズです。Midjourney ボットは、プロンプト内の単語やフレーズをトークンと呼ばれる小さな部分に分割します。トークンはトレーニング データと比較され、画像の生成に使用されます。適切に作成されたプロンプトは、ユニークで刺激的な画像を作成するのに役立ちます。

https://docs.midjourney.com/docs/prompts

これが、ちゃんとした文章ではなく、単語やフレーズの羅列でいい理由です。書かれたプロンプトは「細切れ(トークン)」にされてから、A Iが解析し、それを元にイメージを描き出します。

3.プロンプトを分析するコマンド/shorten

では、トークンはAIによってどのように理解されているのでしょうか。MJには、それを知る手掛かりとなる/shortenというコマンドがDiscordにあります。以下のプロンプトを、/shortenで分析してみましょう。

knolling flowers, pastel colors, minimalist, peachy Wes Anderson colors, flatlay photography, hyperrealistic photography --v 5.2

ノーリング(knolling)/
道具や日用品などを、平行や直角に並べて整理する手法

このプロンプトをそのまま、「/shorten」に続けて、入力(コピペ)します。

実行しますと、すぐに分析結果が返ってきます。

/shorten + プロンプトの分析結果

オレンジの枠で囲まれた太文字になっているいるところが、AIによって、重要と認識されたワードになります。逆に横線で引かれている部分は、AIによってそれ無くてもよくね?と言われている部分です。

続いて、下段の詳細を見る(Show Details)ボタンを押してみましょう。
重要度が数値化、グラフ化され、不要な言葉を提示してくれます。

/shorten + プロンプトの分析結果:詳細を見る

MJがちゃんと表現してくれないな?と感じたときは、/shortenコマンドを使って、自分が書いたプロンプトを分析してみましょう。きっとこのコマンドが役に立つ場面は多いと思います。

4.まとめ

  • プロンプトは、単語やフレーズの羅列でおっけい

  • プロンプトは、より細かいトークンに分解されている。

  • /shortenコマンドで、プロンプトを分析してみよう。


この記事で一番伝えたかったのは、「/shortenコマンド」の使い方です。



注:本著「Midjourneyの教科書」は、Midjourney使用者を対象に書いています。また、記事公開後に、加筆修正、あるいは記事そのものを削除することもよくあります。あらかじめご了承ください。


いいなと思ったら応援しよう!