見出し画像

アカデミック用途でどれを選ぶ?主要LLM3サービスを価格・機能・使い勝手で徹底比較

主要LLMサービス「ChatGPT」「Gemini」「Claude」を徹底比較

近年、ChatGPT、Gemini、Claudeといった大規模言語モデル(LLM)は急速に進化し、仕事や生活に大きな影響を与えています。文章生成や翻訳、コード生成など幅広いタスクをこなせるこれらのサービスですが、それぞれの特徴・料金体系・カスタマイズ性が異なるため、どれを選ぶべきか迷うことも多いでしょう。

本記事では、学術用途(論文作成・助成金申請書の作成など)を想定して、ChatGPT・Gemini・Claudeの3つの主要LLMサービスを徹底比較します。LLM導入の参考にしてください。

本記事は以下の2つの記事の導入部分にあったモデルの特徴の説明を2つ同時に最新にするために執筆したものです。今後モデルのアップデートがあるたびにこちらの記事を更新していきます。


先に結論:どのLLMを選ぶべきか?

  • 初心者やまずは使ってみたい人

    • ChatGPTがおすすめ。理由は以下の通りです。

      1. UIが分かりやすく、操作が直感的。

      2. ユーザー数が多く、使い方の事例やチュートリアルが充実。

  • 出力や文章のクオリティに強くこだわる人

    • GeminiまたはClaudeを検討。

    • 丁寧な回答が好みなら特にGeminiがおすすめ。

  • とにかく無料がいい人

    • Google AI Studio経由でGeminiを選ぶとよいでしょう。

  • 長文(論文や助成金申請書など)を作成する人

    • 長いコンテキストを扱えるGeminiが最有力候補。

    • ただし、無料版は入力データがGoogleに学習される可能性があるため、セキュリティ面を気にするなら有料版も検討を。

    • Claudeでも大規模トークン数を扱えるが、利用制限にかかりやすい点には注意。

2025年1月現在私はGoogle AI Studio経由でGeminiをメインで使い、ChatGPT(pro契約中ですがplusに切替予定)にも一応課金しています。

o1proをそれほど勧めない理由はこちら



1. 価格の比較

ChatGPT

  • 無料プラン

    • 「GPT-4o」を回数制限つきで試用可能。

  • 有料プラン

    • 回数制限の緩和や新機能への優先アクセスが利用可能。

    • 月額約3万円の「Proプラン」では推論モデル「o1pro」が無制限に使えるほか、動画生成数(soraの枠)も増加。

https://chatgpt.com/

Gemini

  • 無料プラン(Google AI Studio)https://aistudio.google.com/prompts/new_chat

    • 実は推論モデル「Gemini-2.0-flash-thinking」はGoogle AI Studioからのみ無料で利用可能。

    • 無料でも普通に使う分にはレート制限に到達しにくいが、入力データがGoogleに学習用として活用される可能性あり。

  • 月額プラン「Gemini Advanced」($20/月)

    • レート制限なく利用可能。

Claude

  • 無料プラン

    • ある程度の回数・コンテキスト長で利用可能。

  • 有料プラン「Claude Pro」

    • 論文など長文を扱う場合に必要となる、コンテキスト長や利用回数の制限が緩和される。

    • チームプランもあり、組織規模に応じて選択が可能。

無料で本格的に長い文章をやりとりしたいなら

  • ChatGPTやClaudeは無料プランだと長文チャット、複数回チャットが難しいケースが多い。

  • どうしても無料がいい人は、Google AI StudioのGeminiが現実的な選択肢。


2. 各種モデルの特徴

ChatGPT

GPT-4oは簡単なタスクは良いのですが、難しいタスク(論文の文脈を理解してレビューする等)はやや心許ないです。o1は自由に仕事をやらせる分には優秀ですが、いろいろ細かい注文をつけて自由を奪うと能力が下がります

GPT-4o

  • ChatGPTのメインモデル。

  • 汎用性が高く、幅広いタスクに対応

  • Officeファイル含め幅広い種類のファイルの入出力に対応

  • ただし癖や機械っぽさが少し残る印象。

  • コンテキスト理解がやや弱いケースあり。

o1(無印)

  • GPT-4oとベンチマーク上のライティング能力はほぼ同等。

  • コンテキストを多く与えてもo1proより出力が劣化しにくい印象。

  • 待ち時間が比較的短く、50回/週程度の利用リミット付き。

o1pro

  • GPT-4oとベンチマーク上は同等レベルのライティング能力。

  • コンテキストが増えると出力が劣化しやすい。

  • 待ち時間が長め

  • Proプランなら利用制限なし。


Gemini 2.0

モデル全般的に「ジェミナイさぼらない」(byシェイン・グウさん)と言われるように出力を端折らず、仕事をきっちりしてくれます。Gemini1.5までは(ベンチマークでは勝っていても)使用感では他のモデルに劣後していることが多かったですが2.0になってかなり良くなりました。

Gemini 2.0 Flash

  • 従来モデルより約2倍速い応答速度。

  • 主要ベンチマークで高精度を示す。

  • テキスト・画像・動画・音声など多様な入力と出力に対応。

Gemini 2.0 Experimental Advanced (Gemini Exp-1206)

  • 論文作成にはこちらがおすすめ(Thinkingモデルよりコンテキスト長が長いため)。

  • Flashより精緻な回答が得られることが多い。

Gemini 2.0 Flash Thinking

  • 問題解決の思考過程を可視化。

  • 強化された推論能力を持つ。

  • Google AI StudioやVertex AI経由で利用可能


Claude

ベンチマーク上は他のモデルに負けていても実際の使用感ではそのタスクで優っていることも多いです。英語、日本語共に自然な文章に定評があります。SonnetはOpusの軽量モデルなのでOpusの登場が待たれます。コーディングも優秀です。

Claude3.5Sonnet

  • 2024年6月21日に初公開、2024年10月23日にアップデート。

  • 機械っぽさが少なく、論理的に整った文章を書くのが得意。

Claude3 Opus

  • 制限がかかりやすいため、現時点では3.5Sonnetがおすすめ。

  • 3.5Opusの一般公開が待たれる状況。


3. ユーザーインターフェイス(UI)・カスタマイズ性

サービス開始から時間の経っているChatGPTがやはり細かいところまで配慮が行き届いているUIになっていると思います。Claudeも当初より改善されて現在はいい感じです。

1位 ChatGPT

  • GPTs機能: 独自のカスタムAIを作成可能。

    • 2025年1月10日時点ではGPTsの裏側はGPT-4oのみ。

  • CANVAS機能(GPT-4o限定): 編集中の文章をスプリットビューで見ながらプロンプト操作が可能。

  • Projects機能: プロジェクトごとに履歴をまとめて管理でき、論文執筆や助成金申請などの用途別に整理可能。

2位 Claude

  • Project機能: GPTsと似た形でカスタマイズ可能。

  • Artifact機能: 生成した文章とプロンプトをスプリットビューで確認できる。

  • Chat履歴もProjectごとに保存され、利便性が高い。

3位 Gemini

  • Gems機能: ユーザー独自データを活用したカスタムAI構築が可能。

    • 2025年1月10日時点では裏側のモデルがGemini1.5のため、性能面でやや劣る。

  • 最大200万tokensのコンテキストウィンドウ: 大量の情報を扱う場面で強みを発揮。


4. トークン数(コンテキスト長)

「コンテキスト長」とは、LLMが一度にやり取りできる入力+出力の合計トークン数のこと。長ければ長いほど、参考文献となる論文を一度に読み込ませるなど、大規模なやり取りが可能になります。

  • 1位 Gemini

    • Gemini-2.0-flash-exp: 1M(100万)トークン

    • Gemini-exp-1206: 2M(200万)トークン

    • Gemini-2.0-flash-thinking: 32Kトークン

  • 2位 Claude

    • Claude3.5Sonnet: 200Kトークン

    • ※ ただし大規模なやり取りを続けると制限に達する恐れあり。

  • 3位 ChatGPT

    • GPT-4o: 128Kトークン(Pro)32Kトークン(Plus)8Kトークン(無料)

    • o1シリーズ: 200Kトークン


5. 入力データの学習への利用

プライバシーや機密情報保護の観点で重要なのが、「入力データがサービス側の学習に再利用されるかどうか」です。2025年1月10日時点の状況は以下のとおり。

ChatGPT

  • 設定でデータ共有をオフにすれば、入力データは学習に利用されないとされている。

settingsのimprove the model for everyoneをoffに

Gemini

  • 有料版「Gemini Advanced」では入力データは学習に再利用しないと明言。

  • 無料のGoogle AI Studio経由の場合は、データが学習に使われる可能性があるので注意。

Claude

  • 有料・無料どちらの場合も、入力データは学習に利用されないとされている。


まとめ:どのLLMを選ぶべきか?

最終的な選択は、利用目的・必要なコンテキスト長・予算・機密情報の取り扱い方針によって異なります。この記事を参考に、ぜひ自分のニーズに合ったLLMサービスを選んでみてください。


最後に

同じプロンプトで生成した架空の論文の文面をLLM別に掲載して終わりにします。個人的には文章自体はClaude3.5Sonnetが一番良いと思いますが、Claude引用をお願いしている文献を1個引用しておらず、回りくどい表現だったり冗長な部分はありますがGeminiを推したいと思います。冗長な表現は今後プロンプトを調整して改善したいと思います。私はnative speakerでは無いのでo1proとGeminiにも(model名はblindとして伏せて)評価(括弧内の表記です)してもらっていますがo1proの採点は微妙だと思います。

Gemini2.0(Exp-1206) (o1pro 9.5/10 Gemini 8/10)

Our initial finding, that therapy A demonstrates superior clinical outcomes for patients with disease X, particularly those exhibiting condition C, compared to therapy B, warrants further discussion. This observation is supported by recent research indicating that patients with disease X who also present with condition C respond more favorably to therapy A. For instance, a cohort study found a significantly higher response rate to therapy A among patients with both disease X and condition C compared to those receiving therapy B [Smith et al., Journal of American Medical Association, 2024]. Furthermore, a retrospective analysis highlighted the need for alternative therapies in this specific patient group, as individuals with disease X and condition C showed a lower response rate to conventional therapy B [Garcia et al., The Lancet, 2020]. The reason for this difference in treatment efficacy may be related to the distinct cytokine profiles observed in patients with condition C. These individuals often show elevated levels of inflammatory markers, such as IL-6 and TNF-α [Brown et al., Journal of Clinical Immunology, 2019]. Therapy A has been shown to effectively reduce these specific inflammatory cytokines, which may explain its improved efficacy in this subgroup [Lee et al., Journal of Immunology, 2018]. However, it is important to note that the efficacy of treatment B may be higher than A in patients with Disease X and a different condition, such as condition D [Johnson et al., New England Journal of Medicine, 2021]. Taken together, these findings emphasize the importance of considering specific patient characteristics, such as the presence of condition C, when selecting the most appropriate treatment for disease X. The potential for improved outcomes using therapy A in this patient population underscores the need for clinicians to consider these factors in their therapeutic decision-making.

Claude3.5Sonnet (o1pro 9/10 Gemini 9/10)

Our first major finding, demonstrating the superior clinical efficacy of Treatment A compared to Treatment B in Disease X patients, particularly those with Condition C, is strongly supported by recent clinical evidence. Smith et al. reported significantly higher response rates to Treatment A in patients with Disease X and Condition C in a comprehensive cohort study [Smith et al., Journal of American Medical Association, 2024], while Garcia et al. identified notably lower response rates to conventional Treatment B in this specific patient population [Garcia et al., The Lancet, 2020]. The underlying mechanism for this differential response appears to be linked to the distinct inflammatory profile of Condition C patients, characterized by elevated levels of pro-inflammatory cytokines [Brown et al., Journal of Clinical Immunology, 2019]. Notably, Treatment A's demonstrated ability to effectively downregulate these inflammatory mediators, particularly IL-6 and TNF-α [Lee et al., Journal of Immunology, 2018], provides a mechanistic explanation for its superior efficacy in this patient subgroup. These findings collectively suggest that Treatment A represents a more targeted therapeutic approach for Disease X patients with Condition C, potentially leading to improved clinical outcomes in this previously challenging-to-treat population.

GPT-4o  (o1pro 9/10 Gemini 7/10)

The first key finding of this study is that Treatment A demonstrated significantly superior clinical efficacy compared to Treatment B in patients with Disease X who presented with Condition C. This result is supported by previous research, which identified a higher response rate to Treatment A among such patients [Smith et al., Journal of American Medical Association, 2024]. Moreover, retrospective analyses have consistently shown that patients with Condition C exhibit a markedly lower response to conventional Treatment B, further emphasizing the need for alternative therapeutic approaches [Garcia et al., The Lancet, 2020]. The heightened inflammatory state associated with Condition C, characterized by elevated cytokines such as IL-6 and TNF-α, is likely a contributing factor to these differences, as Treatment A effectively downregulates these pro-inflammatory markers [Brown et al., Journal of Clinical Immunology, 2019; Lee et al., Journal of Immunology, 2018]. These findings collectively highlight the unique suitability of Treatment A for managing this specific patient population.

o1pro (o1pro 8.5/10 Gemini 7.5/10)

Our first main finding highlights that Therapy A surpasses Therapy B in clinical effectiveness among individuals exhibiting Disease X with Condition C, a conclusion supported by several studies that emphasize the diminished response to conventional Treatment B in such patients [Garcia et al., The Lancet, 2020]. Researchers have observed a unique cytokine profile in patients with Condition C, characterized by elevated levels of IL-6, TNF-α, and IFN-γ, which may alter immune responses and influence therapeutic outcomes [Brown et al., Journal of Clinical Immunology, 2019]. Moreover, Treatment A appears to downregulate these pro-inflammatory cytokines in vitro and in vivo, a mechanism that likely accounts for its favorable results in this specific population [Lee et al., Journal of Immunology, 2018]. Accordingly, this evidence aligns with our data, reinforcing that Therapy A provides superior efficacy for Disease X when accompanied by Condition C [Smith et al., Journal of American Medical Association, 2024]. These findings underscore the importance of individualized treatment strategies that address distinct pathophysiological mechanisms in heterogeneous patient groups.

o1 (o1pro 8.5/10 Gemini 8/10)

The first main finding, which revealed that Treatment A yielded superior clinical outcomes for individuals with Disease X who exhibit Condition C, is supported by multiple studies reporting higher response rates and the need for alternative strategies when Treatment B proves less effective ([Smith et al., Journal of American Medical Association, 2024]; [Garcia et al., The Lancet, 2020]). Researchers attribute this advantage, in part, to the distinct inflammatory profile observed in Condition C, characterized by elevated cytokines such as IL-6 and TNF-α that can alter treatment responsiveness ([Brown et al., Journal of Clinical Immunology, 2019]). Treatment A has been shown to reduce these cytokines both in vitro and in vivo, suggesting an immunomodulatory mechanism that may account for its greater efficacy in this patient subset ([Lee et al., Journal of Immunology, 2018]). By downregulating pro-inflammatory signals, Treatment A may better address the heightened inflammatory state in Condition C, underscoring the importance of personalized therapeutic approaches for Disease X.

これまで沢山の論文の書き方の教科書を読んでいれば「まったく新しい」とは思いませんが、論文のセオリーがわかりやすく言語化されていています。論文の書き方の教科書をあまり読んだことのない方におすすめです。

論文の書き方の教科書の定番。お勧めです。


いいなと思ったら応援しよう!