見出し画像

Gemini 2.0 Flash Thinking 試験運用版の思考プロセス、強力な推論能力って?

コストパフォーマンスに非常に優れていて、SLA が明確な Gemini Flash。特にソフトウェアの開発で急激に利用されはじめています。OpenRouter(LLM のマーケットプレイス的なサイト) での LLM 利用をみてもその人気度がわかります。なんと 9 月と比較して 20 倍以上に!12 月には約半数のアプリで採用されているようです。

OpenRouter の Completion requests(LLM の利用状況)

Gemini 2.0 試験運用版登場

さて、そんな Gemini Flash ですが、現在、Gemini 2.0 の試験運用版を無料で利用できます。Gemini 2.0 Flash には 2 つのモードが提供されています。

  • Gemini 2.0 Flash Experimental:高速処理に特化したモデル

  • Gemini 2.0 Flash Thinking Experimental:思考プロセスを生成するモデル(通称:思考モード)

Gemini 2.0 Flash Thinking Experimental(思考モード)は、 Chatbot Arena の LLM 性能パフォーマンスのランキングで 2 位。特に、Math(数学)カテゴリでは、1 位となっています。さて、この思考モードとは何でしょう?Google は次のように説明しています。

Gemini 2.0 Flash 思考モードは、回答の一部としてモデルが行う「思考プロセス」を生成するようにトレーニングされた試験運用版モデルです。その結果、Thinking Mode は、ベースの Gemini 2.0 Flash モデルよりも、レスポンスでより強力な推論機能を備えています

Google AI for Developers : https://ai.google.dev/gemini-api/docs/Thinking-mode?hl=ja

つまり、思考モードは、ベースとなる Gemini 2.0 Flash よりも、より強力な推論機能を持っており、思考プロセスを出力するということのようです。では、通常モードと何が違うのでしょうか?

歯医者さんの例えで見てみよう

強力な推論機能について、歯医者さんを例に説明します。

  • 普通の歯医者さん
    レントゲンを見て「ここに虫歯がありますね、削って詰めましょう」と、問題のある歯だけを見て治療を始めます。

    • 推論する歯医者さん
      レントゲンに加え、あなたの生活習慣、歯磨きの癖なども考慮し、虫歯の原因を深く掘り下げて考えます。 そして、将来的なリスクまで予測し、本当に最適な治療計画を立ててくれます。 また、他の歯についても注意深く確認し、「この歯も初期の虫歯ができ始めているので、今のうちに治療しておいた方がいいかもしれませんね」と提案してくれます。

      Generated by ImageFX (Imagen 3)

      さらに、治療中の説明にも違いがあります。

      • 黙々と治療する歯医者さん
        「はい、次ー」「口開けてー」と指示を出すのみで、治療スピードは早いですが、説明はほとんどありません。

        • 思考する歯医者さん
          「今から、ラウンドバーという小さなドリルを使って、初期の表面にできた虫歯を慎重に削っていきますね。少し振動がありますが、神経にできるだけ影響がないように、慎重に進めていきますねー」と、今何をしているのか、なぜそれが必要なのかを丁寧に説明してくれます。

          思考プロセスが見えることのメリットとは

          思考する歯医者さんのように、思考プロセスを説明してくれることで、どのようなメリットがあるのでしょうか?

          • 安心感: 今、何が起こっているのかを理解できるので、不安が和らぎます。

          • 納得感: 治療の意図や目的が明確になるので、安心して治療を受けられます。

          • 学習効果: 自分の歯の状態や、治療の重要性を理解することができます。

          • 信頼感: 丁寧な説明により、先生への信頼感が増します。

          どの Gemini を選ぶ?〜利用料金と賢い使い分け〜

          一般的に、高性能なモデルほどそれに見合った料金設定となる傾向があります。今は、どちらも Experimental(試験運用版)なので、無料で利用できますが、「Gemini 2.0 Flash Thinking」は、「Gemini 2.0 Flash」よりも利用料金が高くなる可能性があると思った方がいいかもしれません。

          • Gemini 2.0 Flash Experimental: スピード重視!素早く答えが欲しい時や、コストを抑えたい場合に。頼れるテキパキしたアシスタントとして活躍してくれるでしょう。
            特にソフトウェアの開発などでは、大量のデータを処理する場合や、リリース後コストパフォーマンスが必要な場合などにいいかもしれません。

          • Gemini 2.0 Flash Thinking Experimental: じっくり考えたい!深い洞察を得たい時や、多少コストがかかっても、より丁寧な説明や高度な分析が必要な場合に。まるで、じっくり話を聞いてくれる名医のような存在です。
            特にソフトウェアの開発では、開発中に LLM の思考プロセスを検討しながらプロンプトを検討する場合などにいいかもしれません。

          Gemini 2.0 Experimental は Vertex AI StudioGoogle AI Studio で利用可能です。ぜひ、Gemini を賢く使い分け、パフォーマンスとコストの最適なバランスを見つけ、そのポテンシャルを最大限に引き出しましょう。


          いいなと思ったら応援しよう!