見出し画像

生成AIを使いこなす効果的な「プロンプト」の書き方のコツを日本MSが説明

 Microsoftが提供する「Copilot」は、生成AIを活用したチャットbot機能です。日本語にも対応しており、Windows 11/10には「Copilot in Windows」という名称でOSに組み込まれています。PCだけでなく、スマートフォンアプリ(Android、iOS)からも利用できます。僕はPCとスマホで使っています。GPTとBingの両刀遣いです(笑)。

*以下記事は、上記リンク記事から部分抜粋。

 マイクロソフトは、ChatGPTを開発した米OpenAIとパートナーシップを結んでおり、CopilotもChatGPTに使われている大規模言語モデル(GPT)をベースにしています。ChatGPTにBingの検索アルゴリズムを統合したものと考えればいい・・・と書いてあります。
 Copilotは、ユーザーが実現したいと思う作業を、自然な言葉で指示、問いかけることで実行できます。重要なのは、Copilotにどう問いかけるかによって、返答される内容の質に差が生まれてきます。これはチャットbot型AIは同じです。

 3月5日に行われた記者向け説明会では、マイクロソフト ディベロップメントの篠塚祐紀子氏(WWE Japan 開発統括本部 プロダクト マネージャー)は、「Copilotを使うときに入力する“プロンプト”のコツは3つある」と説明しました。それが次の3つです。

「目的を説明する」

 まずは人に物事を分かりやすく伝えるのと同じように、Copilotによって何をしたいのか、何を知りたいかをしっかりと言葉で表現すること。

 複雑な答えを求めたい場合は、指示を各ステップに分割し、どの順番で考えるべきかまで伝えるようにするといいという。例えば「以下のステップに従ってください。(1)○○の利点を3つ列挙して、(2)○○の欠点を3つ列挙して」と書くというものだ。

 こういったプロンプトを投げかけることで、回答が分かりやすく記述されて返ってくる可能性が高まる。

「場面と役割を設定する」

 何らかのアイデアをCopilotに求める場合、場面と役割を定義してから指示するのも有効だ。例えば、簡単なパスタレシピをCopilotに尋ねるなら、「家にある食材を使った」「トマトベースの」といった状況(場面)説明の補足を付け加えることで、求める回答を得られやすくなる。

 他にも、結婚式のスピーチの原稿を考えてもらいたい場合、自分がどのような立場(役割)で参加するのか、誰の結婚式なのかといった背景情報を前提条件として付け加えることによって、提案されるスピーチ内容の方向性やニュアンスが調整される。

「回答の表現方法や出力方法を伝える」

 Copilotに回答を求める際に、その表現方法も指示できる。どういったスタンスの季節のあいさつなのか、どのようなトーンでメールの例文を書いてほしいのか、調べた内容を表や箇条書きで回答できないか、あらかじめ指示することによって望んだ形の回答が得られることになる。これはまさに生成AIの強みといえるだろう。

●画像生成機能「Image Creator from Microsoft Designer」のコツ

 Copilotには、「Image Creator from Microsoft Designer」と呼ばれる画像生成機能も搭載されている。ここでも思い描く絵を生成するコツがあると篠塚氏は説明している。
「説明的な言葉を最低6つは入れる」
「テーマやビジュアルスタイル、シーン、設定、画像の種類、照明の位置、カメラやレンズまで指示する」
「比喩表現やユーモアといった文言を加える」というものだ。こうした補足をしっかりと行うことで、斬新で面白い画像が生成できるとしている。

以上、上記リンク記事から抜粋したものです。

 なるほど・・・。AI画像で物語を作ろうとしても、同じ顔を生成しないし、同じ衣装を着せてくれないので統一性がとれずに、きちんとしたお話ができません。だから僕が作るものは常にバカな話になってしまいます。

 それでも②は重要です。自分の思う画像を作るのは難しいのです。②のように僕も(女子高生探偵談、女子高生探偵のビジュアル、シーン、構図・画角、画風)を指定し指示しますが、なかなか思うようにはいきません。

「Copilotにはできないこと」

 Copilotにはできないことがあります。画像プロンプトを教えてくれないことです。僕がGPT(DALL-E3)で画像生成する場合、「理想的な画像」が生成されると、すかさず「プロンプトとシード値」を必ず聞くことにしています。機嫌が良いと答えてくれるので、それをコピーしてメモり、「プロンプト集」を作っています。さらにコピーしたプロンプトテキストをGPTの入力欄に貼り付けて、いくつもの同じような画像を生成しています。これでAI側で同じような顔を作れるようになります。これで作ったのが「AIグラビア」です。

「実験」

GPTで生成した画像

この画像のプロンプトをCpilotに聞くと「申し訳ありませんが、プライバシーの観点から、添付された画像のプロンプトは提供できません。ただし、画像の説明を以下に示します。

  1. 画像には2人の人物(*)がオーナメントのあるソファに座っており、(プライバシー保護のために顔は隠されています)。

  2. 両者(*)は白い襟のついた青いドレスと、ひざ丈の白い靴下を着用しています。

  3. 彼ら(*)は大きな詳細な絵画の前に座っており、田園風景の中の一団の人々が描かれています。

  4. ソファは複雑なデザインで、ヴィンテージのように見えます。

何か他の質問があればお知らせください。😊」と答えます。

それでは、上記の1~4の太字までをコピーしてGPTとCopilotの入力画面に貼り付けて実行すると以下の画像が現れました。怖いですよ。

GPTが生成した画像
Copilotが生成した画像 またまた足が多いのです

GPTにもCopilotの画像にも人物の顔にボカシが入っているのは、指示文の中(*)のように「2人の人物」、「両者」、「彼ら」・・・と性別、顔立ちなど具体的な説明がないからです・・・と思ったら、この部分を「2人の若く美しい女性」と直して入力しても、顔にボカシが入った画像しか生成しませんでした。

あららら、AIに祟られたのかも? と思ったら・・・「プライバシー保護のために顔は隠されています」と書いてあるからでした。バカですねぇ~。ソレを外したら以下の画像が生成されました。良かった。

いいなと思ったら応援しよう!