見出し画像

さよならClaude、こんにちはGemini 〜Claude愛用者がGeminiに乗り換えた理由〜

大規模言語モデルの進化は目覚ましく、新しいモデルが次々と登場する中、Gemini 2.0シリーズに注目しています。

上記記事を出してから私は1年弱ほど、Claude 3.5をメイン使用してきました。Claudeは「いいヤツ」で個人的にも愛着があったのですが、後ろ髪を引かれつつ最近Geminiに乗り換えました。(Claude 3.5Opusが出たらまた戻るかもしれません)

Gemini乗り換え以前は以下のような生成AI使い分けをしていました。

Geminiに乗り換えた理由と実際に使ってみた感想を以下にまとめます。


Gemini 2.0シリーズの特徴

Gemini 2.0シリーズは、以下の3つのモデルを展開しています。

  1. Gemini 2.0 Flash

    • 高速応答: 前モデルの約2倍の速度で回答を生成。

    • 高精度: ベンチマークでも高水準の性能を発揮。

    • マルチモーダル対応: テキスト、画像、動画、音声など多様な形式の入出力が可能。

  2. Gemini Exp-1206

    • 正式な情報はありませんが、Gemini Advancedの表記は2.0 Experimantal AdvancedとなっておりFlashモデルの軽量化前の元モデルであると推測しています。

    • Flashよりも精緻な回答を出す傾向があり、内容に深みがあります。

  3. Gemini 2.0 Flash Thinking

    • 思考過程の可視化: 問題解決プロセスをステップごとに明示。

    • 強化された推論能力: 複雑な問題にも迅速かつ的確に対応可能。

私個人の印象ですが、Gemini 2.0 Flash Thinking、Gemini Exp-1206、Gemini 2.0 Flashの順に複雑なタスクができるイメージです。

Geminiを選んだ理由

ベンチマークと実際の使用感の乖離はよく言われることですが、以下は私の個人的な印象であることはご留意ください。

(1) 丁寧で精緻な文章生成

Geminiの最大の特徴は、回答が丁寧で細かい内容である点です。例えば表現の言い換えを依頼した場合には、依頼せずとも複数候補を提示してくれて、それぞれの表現のニュアンスの解説までしてくれるため、非常に納得感のある結果が得られます。

(2) 長文作成の強み

Geminiは最大8,192トークンの出力に対応しており、これはClaudeやChatGPTと同様のはずですが、同じ質問をしてもGeminiの方が詳しくて長い回答をする傾向があります。また従来、長文になると文章が薄くなりがちで、内容の無い文章が繰り返されることもありましたが、Geminiではそういった現象が見られにくい印象です。従来は長文を生成させる際に、文章が薄くなるため、小分けにしてリクエストする必要がありました。しかし、Geminiではその傾向が少なく、まとまりのある長文を一度に生成できるため、効率が向上しました。

(3) 真面目で仕事をサボらない

Geminiは無機質なエージェントでClaudeと比べると愛着は湧きにくいですが、論文全体の校正なども隈なく丁寧にやってくれるので、その生真面目さに相棒としての信頼を寄せることはできます

(4) コンテキストの理解力

読解力についてはこれまではClaudeが優れていましたが、Gemini2.0系はClaude3.5とほぼ同等だと思います。論文の解説やReviewをさせて核心に迫る解説や指摘ができるかで評価しています。ChatGPTはo1シリーズ含めこの能力は今一歩な印象です。

(5) 使用制限を気にしなくて良い点

Geminiのもう一つの大きなメリットは、トークン数や利用制限をほとんど気にせずに使える点です。これは、作業効率を大きく向上させるだけでなく、ストレスフリーで利用できるという心理的な安心感もあります。論文執筆時にも参考資料などを沢山与えた上でそのまま書き続けることができます。

(6) 高速な応答時間(特に推論モデル)

ChatGPTのo1シリーズなどの推論モデルでは、1分以上待たされることもあり、集中力が途切れることがありました。これに対し、Gemini 2.0 FlashThinkingでも数秒での応答を実現しており、複雑なタスクでもストレスを感じません。待機時間が短いため、作業に集中して取り組めます。

Codingについては私が得意ではないのと使用機会が少ないのでコメントは控えさせていただきます。


Gemini AdvancedとAI Studio

有料プラン Gemini Advanced

Gemini Advancedでは、`2.0Flash-Exp`と`Exp-1206`のモデルが利用可能です。

さらに、Gmailとの連携機能も備えており、メールやスレッドの要約をAIに任せることができます。しかし、現時点でのGmail連携機能はあくまでユーザーが指示してから返信などを作成するので、ChatGPT研究所さんが提供するGmailのGAS(Google Apps Script)を利用した自動返信作成の方が、勝手に下書きができている状況なのでユーザー体験としては上に感じます。

Gemini AdvancedではEnterキーで送信される仕様も、慣れるまでは不便に感じるかもしれません。

また、Gemini AdvancedではGoogle Deep Search機能が使えることがメリットですが、学術的な用途における精度はまだ十分とは言えず、筆者自身は積極的に活用していません。

加えて、`2.0Flash-Exp`の入力トークン数に約8,000程度?の制限が設けられている点も、長文を扱う際には留意すべきポイントです。さらに、Gemini Advancedで利用できるGems(Google版GPTs)は、Gemini 1.5モデルをベースとしているため、最新の2.0シリーズの性能を求めるユーザーには物足りないかもしれません。

無料で利用可能なGoogle AI Studio

Google AI Studioでは、強力な推論モデルである`2.0 Flash Thinking`無料で利用できます。

`2.0 Flash Thinking`は、複雑な問題解決や高度な推論を必要とするタスクにおいて、非常に優れたパフォーマンスを発揮します。またGemini AdvancedではExp 1206へのアップロードできるファイルの種類に制約がありますがAI Studioでは制約がありません。ここでは「有料プランのGemini Advancedよりも、無料のAI Studioの方が高性能なモデルを利用できる」という、ある種の逆転現象が生じているのです。

データ利用規約の確認は必須:プライバシーへの配慮

ただし、データの取り扱いについては注意が必要です。Gemini Advancedでは、ユーザーの入力データは収集されないと明記されています。一方、AI Studioでは、Googleにデータが収集されます。

プライバシーを重視するユーザーは、この点を十分に考慮した上で、利用するサービスを選択する必要があるでしょう。

現状の最適解:目的に応じた使い分けが重要

では、結局のところ、どのようにGeminiを活用するのが最適なのでしょうか。筆者の現状の結論は、Deep Searchを使わなくてGoogleのデータの収集を気にしないのであればGoogle AI Studioを使用するです。実際に、筆者自身もGemini Advancedの契約を解除し、この運用方法に切り替えています。

もちろん、将来的には、`2.0 Flash Thinking`を含むGoogle AI Studioの優れたモデル群が、Gemini Advancedへ統合されることを期待しています。その暁には、迷わずGemini Advancedへの再契約を検討します。


まとめ

本記事では、Claude 3.5からGemini 2.0シリーズに乗り換えた筆者の経験に基づき、その実力と現状の課題を解説しました。

Gemini 2.0シリーズ、特に2.0 Flash Thinkingは、文章生成、長文作成、文脈理解、応答速度において、従来のモデルを上回る性能を示しています。これは、多様な知的作業の効率化と質の向上に大きく貢献するでしょう。

将来的には、Gemini Advancedへの2.0 Flash Thinkingの統合やサービス全体の最適化が期待されます。それが実現されれば、Gemini 2.0シリーズはさらに強力で不可欠なツールとなると思います。

こちらも少しずつGemini仕様にしていきたいと思います。

これまで沢山の論文の書き方の教科書を読んでいれば「まったく新しい」とは思いませんが、論文のセオリーがわかりやすく言語化されていています。論文の書き方の教科書をあまり読んだことのない方におすすめです。


いいなと思ったら応援しよう!