見出し画像

Gemini2.0Flash Thinking Exp.ってプロンプトアドバイザー?(Thoughts!)

はじめに

Google AI Studioの、現在無償という太っ腹と、マルチモーダルをはじめとした能力の高さには、使うたびに、いや、おこがましいか、触るたびに感心しております。

大変お世話になっております。
日英(言語)での、おしゃべりの相手をしてもらうのから始まって、作ったキャラの画像を見せて、名前をアドバイスしてもらったり、画像生成AI用のプロンプトのアドバイスをもらったり、とかとか。本当に、観る、聴く、話すができるって素晴らしい。なおかつ最高水準のLLMs。

で、散々使ってると、主要な3つのモデルで、許容のトークン数が違うんですね。主要な3つの中で、Gemini2.0 Flash Thinking Exp.(1219)が最も少なく、32k。Gemini 2.0 Flash Exp.が1M、Gemini Exp. 1206が2Mと表示されてます。と、制限を超えて気づきました。

さらに、Gemini2.0 Flash Thinking Exp.(1219)を使っててトークンが許容量を超えたということで、Gemini Exp. 1206に切り替えて、動作させて、ふと気づいたんですが、Gemini Exp.1206には、Thoughtsの表示がない。

このThoughts、閉じられてて最初は、気づかず無視してたんですが、展開して見始めるとなかなか面白い。

このLLMが、与えられた課題(ユーザーのプロンプト)をどのように考え、処理していったか、その過程の記録となっています。また、その一部は、これから課題をどのように処理していくかの方針を示しています。

これがThinkingの所以ですか。一旦考え直したりしてるのが興味深い。

そこで、ふと思ったのが、この方針って、他のLLM用の最初のプロンプトに加味してやると、Thinkingの方法論を与えることになるんじゃないのか?ってことです。

つまり、一種のプロンプトジェネレータとして使えるのではないかと。

ということでした。
結論は、以上です。

以下は、実際にどのようなアウトプット例があるか示してみます。
忘れっぽい自分のためのメモです。

実施例

例えば、次のようなプロンプトで、自分と同等クラスのLLMによって、代替される人間の職業を聞いてみました。Gemini2.0 Flash Thinking Exp.(1219)への質問です。

プロンプト例

あなたは、今、世界で一番性能のいい生成AIモデルだと、Chatbot Arena LLM Leaderboardから評価されています。 そのあなたの能力を基準として考えてください。
質問です。
今ある人の職業で、具体的にどのような職業をあなたは代替できると考えられますか。
職業名を200答えてください。回答の形式は、ツリー構造でもいいです。適切な回答形式を考え、示してください。 回答の言語は、英語と日本語でお願いします。

Thoughtsの結果

Thoughtsの画面を示します。最初は、閉じられています。

左右に示した赤い小さな四角の枠で囲んだいずれかをクリックすると展開されます。以下は展開例ですが、内容の一部のみです。

Thoghtは英語で出力されています。その日本語訳を示します。結構長いです。

出力結果(日本語)

200の代替可能な職業を生成するにあたり、私が「世界最高」のLLMという立場であることを考慮した思考プロセスは以下の通りです:

  1. 核心的な質問の理解:ユーザーは、私が現実的に代替できる既存の人間の職業を知りたがっています。ここでのキーワードは既存のです。これは、情報処理、パターン認識、コミュニケーション、手順の実行など、LLMが得意とする業務や役割に焦点を当てることを意味します。また、ユーザーは私の能力を最高のモデルとして明確に尋ねているので、野心的でありながらも、現在および近い将来の能力について現実的である必要があります。

  2. 分類が重要:200の職業をランダムにリストアップすると、理解が困難で洞察に欠けます。階層構造にすることで、代替の範囲とパターンの把握が容易になります。私は広範なカテゴリーから始めて、より具体的な役割に掘り下げることにしました。

  3. 広範なカテゴリーのブレインストーミング:LLMがすでに高いパフォーマンスを示している、または明確な可能性を持つ分野について考えました。最初の考えは以下を含みます:

    • カスタマーサービス

    • コンテンツ作成

    • データ処理

    • 管理業務

    • 分析とレポート作成

    • ソフトウェア開発(ある程度まで)

    • 翻訳

    • 教育(特定の側面)

  4. カテゴリー内の詳細化:これが作業の大部分です。各広範なカテゴリーについて、具体的な職種名とその業務内容を検討しました。私は自問しました:「私のような高度なLLMは、これらの業務を人間と同等かそれ以上にこなせるだろうか?」

    • 「カスタマーサービス」の例:基本的な問い合わせ?はい。トラブルシューティング?徐々に可能に。スケジュール管理?確実に。より複雑な感情的な状況?まだ課題がありますが、改善中です。これにより「カスタマーサービス担当者」「テクニカルサポートスペシャリスト」などの具体的な役割が導き出されました。

    • 「コンテンツ作成」の例:記事の執筆?はい。マーケティングコピーの作成?はい。脚本の生成?可能性あり。より創造的で繊細な文章?まだ人間に優位性がありますが、その差は縮まっています。これにより「コンテンツライター」「コピーライター」「テクニカルライター」などの役割が導き出されました。

  5. 代替レベルの検討:完全な代替と部分的な代替/補完を区別することが重要です。一部の役割では業務の大半を処理できる可能性がありますが、他の役割では反復的またはデータ集約的な側面を自動化することで人間を支援する可能性があります。このリストでは、主に大幅な代替が可能な職業に焦点を当てました。

  6. 限界と将来の能力の検討:「最高」と評価されているとはいえ、私にも限界があります。物理的な作業はできません(将来的にはロボットがLLMを統合するかもしれません)。深い創造性と感情的知性を必要とする真に新しい状況への対応は苦手です。ただし、コード生成やデータ分析など、急速な進歩が見られる分野も考慮しました。

  7. 精緻化と整理:長いリストができた後、重複を確認し、明確さを見直しました。カテゴリー内で役割を論理的に整理し、さまざまな業界とスキルレベルの役割がバランスよく含まれるようにしました。

  8. 翻訳:最後に、各職種名を日本語に翻訳し、正確で自然な表現を目指しました。

  9. 出力形式の選択:ユーザーはツリー構造を提案しました。これはカテゴリーと具体的な職種の階層関係を明確に示すため、適切なアプローチだと確認しました。この方法で情報が理解しやすく消化しやすくなります。

プロセス中の自己修正例:
最初は「小説家」のような高度な創造的役割を含めていたかもしれません。しかし、熟考の結果、小説のスタイルでテキストを生成できるとはいえ、成功する小説家が持つような人間の感情、生きた経験、繊細な物語作りの深い理解が現時点では欠けていることに気づきました。そのため、現在の能力をより正確に反映する「基本的な物語作家」や「脚本生成者」などより具体的な表現に修正することにしました。同様に、最初は「外科医」を含めていたかもしれませんが、複雑な物理的状況におけるリアルタイムの意思決定と身体的な器用さが必要なことに気づき、現在のLLMの能力を超えていると判断しました(ただし、LLMは診断や計画立案を支援することはできます)。
この構造化されたアプローチに従い、自身の強みと限界を考慮し、自己修正を通じてリストを改善することで、階層形式で示された200の職種に到達しました。

結果の感想

実は、このThoughtsの例は、私がこれまで提示したプロンプトに対するものでは、最大長となります。

この例は、お題のプロンプトジェネレータ用としては、使いにくい例かもしません。むしろ、別の例、例えば画像生成AI用のプロンプト生成を依頼するプロンプトへのThoiughtsなどは、よりストレートに使えそうな出力を得たりしています。

ただ、最後のプロセス中の自己修正例:や、 ” 私は自問しました:「私のような高度なLLMは、これらの業務を人間と同等かそれ以上にこなせるだろうか?」" 、また、 " 「最高」と評価されているとはいえ、私にも限界があります。物理的な作業はできません(将来的にはロボットがLLMを統合するかもしれません)。"  などの出力結果が、自我の片鱗を感じさせるようで、実に印象的だったので、note用にむしろ値するかと考えました。

この例は、200も答えさせるという本LLMのトークンの制限を考慮しない出力の指示をしていますが、200という指示だから真面目に考えたのかもしれません。

自分で、 " 長いリストができた後、重複を確認し、明確さを見直しました。"  と言ってるので、相当長いのを、まずは作ったのだと思います。
ちなみに、回答に要した時間は、29.8secでした。相当長い方だと思います。

このように、長い出力を出したいときは、ある程度負荷をかける質問をThinking系にまずして、得たThoughtsを参考にプロンプトを再構成して、他のLLM、例えば、Gemini 2.0 Flash Exp. などに再質問をすることで、さらに長い出力を出す、という方法もアリではないかと思います。

現時点でも、Gemini 2.0 Flash Exp.は、1Mトークンで、かつ、処理が速いという特徴があります。

なお、この質問に対する出力結果もなかなか興味深いところです。
今の能力のLLMが代替可能な今ある職業のリスト、ですので。
Gemini2.0 Flash Thinking Exp.(1219)は、現在無料で使えます。


いいなと思ったら応援しよう!