主要LLMサービス「ChatGPT」「Gemini」「Claude」を徹底比較
近年、ChatGPT、Gemini、Claudeといった大規模言語モデル(LLM)は急速に進化し、仕事や生活に大きな影響を与えています。文章生成や翻訳、コード生成など幅広いタスクをこなせるこれらのサービスですが、それぞれの特徴・料金体系・カスタマイズ性が異なるため、どれを選ぶべきか迷うことも多いでしょう。
本記事では、学術用途(論文作成・助成金申請書の作成など)を想定して、ChatGPT・Gemini・Claudeの3つの主要LLMサービスを徹底比較します。LLM導入の参考にしてください。
本記事は以下の2つの記事の導入部分にあったモデルの特徴の説明を2つ同時に最新にするために執筆したものです。今後モデルのアップデートがあるたびにこちらの記事を更新していきます。
先に結論:どのLLMを選ぶべきか?
初心者やまずは使ってみたい人
ChatGPTがおすすめ。理由は以下の通りです。
UIが分かりやすく、操作が直感的。
ユーザー数が多く、使い方の事例やチュートリアルが充実。
出力や文章のクオリティに強くこだわる人
GeminiまたはClaudeを検討。
丁寧な回答が好みなら特にGeminiがおすすめ。
長文(論文や助成金申請書など)を作成する人
長いコンテキストを扱えるGeminiが最有力候補。
ただし、無料版は入力データがGoogleに学習される可能性があるため、セキュリティ面を気にするなら有料版も検討を。
Claudeでも大規模トークン数を扱えるが、利用制限にかかりやすい点には注意。
2025年1月現在私はGoogle AI Studio経由でGeminiをメインで使い、ChatGPT(pro契約中ですがplusに切替予定)にも一応課金しています。
o1proをそれほど勧めない理由はこちら
1. 価格の比較
ChatGPT
https://chatgpt.com/
Gemini
Claude
無料で本格的に長い文章をやりとりしたいなら
2. 各種モデルの特徴
ChatGPT
GPT-4oは簡単なタスクは良いのですが、難しいタスク(論文の文脈を理解してレビューする等)はやや心許ないです。o1は自由に仕事をやらせる分には優秀ですが、いろいろ細かい注文をつけて自由を奪うと能力が下がります。
GPT-4o
o1(無印)
GPT-4oとベンチマーク上のライティング能力はほぼ同等。
コンテキストを多く与えてもo1proより出力が劣化しにくい印象。
待ち時間が比較的短く、50回/週程度の利用リミット付き。
o1pro
Gemini 2.0
モデル全般的に「ジェミナイさぼらない」(byシェイン・グウさん)と言われるように出力を端折らず、仕事をきっちりしてくれます。Gemini1.5までは(ベンチマークでは勝っていても)使用感では他のモデルに劣後していることが多かったですが2.0になってかなり良くなりました。
Gemini 2.0 Flash
Gemini 2.0 Experimental Advanced (Gemini Exp-1206)
Gemini 2.0 Flash Thinking
Claude
ベンチマーク上は他のモデルに負けていても実際の使用感ではそのタスクで優っていることも多いです。英語、日本語共に自然な文章に定評があります。SonnetはOpusの軽量モデルなのでOpusの登場が待たれます。コーディングも優秀です。
Claude3.5Sonnet
Claude3 Opus
3. ユーザーインターフェイス(UI)・カスタマイズ性
サービス開始から時間の経っているChatGPTがやはり細かいところまで配慮が行き届いているUIになっていると思います。Claudeも当初より改善されて現在はいい感じです。
1位 ChatGPT
2位 Claude
Project機能: GPTsと似た形でカスタマイズ可能。
Artifact機能: 生成した文章とプロンプトをスプリットビューで確認できる。
Chat履歴もProjectごとに保存され、利便性が高い。
3位 Gemini
4. トークン数(コンテキスト長)
「コンテキスト長」とは、LLMが一度にやり取りできる入力+出力の合計トークン数のこと。長ければ長いほど、参考文献となる論文を一度に読み込ませるなど、大規模なやり取りが可能になります。
1位 Gemini
Gemini-2.0-flash-exp: 1M(100万)トークン
Gemini-exp-1206: 2M(200万)トークン
Gemini-2.0-flash-thinking: 32Kトークン
2位 Claude
3位 ChatGPT
5. 入力データの学習への利用
プライバシーや機密情報保護の観点で重要なのが、「入力データがサービス側の学習に再利用されるかどうか」です。2025年1月10日時点の状況は以下のとおり。
ChatGPT
Gemini
Claude
まとめ:どのLLMを選ぶべきか?
最終的な選択は、利用目的・必要なコンテキスト長・予算・機密情報の取り扱い方針によって異なります。この記事を参考に、ぜひ自分のニーズに合ったLLMサービスを選んでみてください。
最後に
同じプロンプトで生成した架空の論文の文面をLLM別に掲載して終わりにします。個人的には文章自体はClaude3.5Sonnetが一番良いと思いますが、Claude引用をお願いしている文献を1個引用しておらず、回りくどい表現だったり冗長な部分はありますがGeminiを推したいと思います。冗長な表現は今後プロンプトを調整して改善したいと思います。私はnative speakerでは無いのでo1proとGeminiにも(model名はblindとして伏せて)評価(括弧内の表記です)してもらっていますがo1proの採点は微妙だと思います。
Gemini2.0(Exp-1206) (o1pro 9.5/10 Gemini 8/10)
Claude3.5Sonnet (o1pro 9/10 Gemini 9/10)
GPT-4o (o1pro 9/10 Gemini 7/10)
o1pro (o1pro 8.5/10 Gemini 7.5/10)
o1 (o1pro 8.5/10 Gemini 8/10)
これまで沢山の論文の書き方の教科書を読んでいれば「まったく新しい」とは思いませんが、論文のセオリーがわかりやすく言語化されていています。論文の書き方の教科書をあまり読んだことのない方におすすめです。
論文の書き方の教科書の定番。お勧めです。