![見出し画像](https://assets.st-note.com/production/uploads/images/163000703/rectangle_large_type_2_1d83a4f9b2d9c1ae47c82b8cd1c38e0b.png?width=1200)
研究・臨床補助における生成AIツールの使い分け(2024年11月時点)
生成AI技術は日進月歩で進化を続けており、各サービスの性能や機能も頻繁にアップデートされています。本記事では、2024年11月時点での私個人の使用経験に基づいて、研究活動や臨床補助における各AIツールの特徴と使い分けについてご紹介します。なお、これはあくまでも個人的な使用経験と好みに基づくものであることをご了承ください。
要点としては以下のような感じです。
私が現在、研究目的、臨床補助で使っている有料/無料の生成AIサービスを頻度順にまとめました
— 限界助教|ChatGPT/Claudeで論文作成と科研費申請 (@genkAIjokyo) November 17, 2024
(図はClaude3.5Sonnetのartifactで作成) pic.twitter.com/cYCFnWHUKP
1. Claude 3.5 Sonnet(課金中)
主な用途:
論文のMaterial & Methods、Resultセクション
論文読解補助(ざっと要点を把握したい時に利用。Figureの解説が可能。ChatGPTよりも内容理解が深い)
依頼原稿(自分の英語論文を基に総説を書かせる、使い回し文章のパラフレーズなど)
教科書執筆(必ず参考資料を元に作成)
講演のタイトル作成(複数の候補を生成してから選ぶ)
スライドレビュー(構成の修正アイディア、英語の校正)
統計解析(コードを記述し、VScodeで実行)
レビューアーへの回答作成(ChatGPTよりも内容理解が深いため)
レビュワーとしてレター作成(レビューは自分で行い、要点を渡して文章を整えてもらう。リジェクト時のコメントも辛辣になりすぎないようにできる)
Claudeで文字だけでなくPDF内の図が読めるように!
— 限界助教|ChatGPT/Claudeで論文作成と科研費申請 (@genkAIjokyo) November 1, 2024
論文読解が捗りそう
今まで論文内のFigureの解説させた事無かったけど何となくFigureも読めていると勘違いしてました😅
ChatGPTも実はPDF内の図は読み込めていなかった? https://t.co/UruOJyAQD9
特徴:
Claude 3.5 Sonnetは特に読解力と自然な文章生成能力に優れています。複雑な論文の内容を正確に理解し、適切な要約や解説を提供できる点が特筆すべき特徴です。Claudeが読解力に優れているということは私の印象だけでなく研究でも示されているようです。
Claude 3.5は情報の流れを追跡する能力に優れているとのこと。例えば、A→B、B→C、C→D...といったデータが多く与えられても、比較的根気強く最後まで正確に確認できるようです。https://t.co/CcVmazO7hx
— AIDB (@ai_database) November 13, 2024
複数の情報が絡み合う長文ドキュメントを正確に理解する際にはこのような能力が役に立ちます。…
メインのツールとして頻繁に使用しています。統計解析のPythonコードに関しては、Claudeの方がo1-previewよりもエラーが少ないコードを生成してくれることが多い印象です(コーディングは私はスキルないので参考程度にしてください)。
2. ChatGPT(課金中)
主な用途:
o1-previewでの申請書作成や論文執筆(特にIntroductionとDiscussion部分に有用)
o1-previewによる病歴からの鑑別診断の列挙(国家試験98%だけあって知識や推論力は強い)
Advanced Voice Modeを使用した英会話練習や研究アイディア壁打ち
正答率 98.2%
— Naoto Usuyama (@naotous) November 8, 2024
OpenAI の o1-preview が医師国家試験で正答率 98.2% を記録しました
日本語の問題を翻訳せず、そのまま読ませた結果です
knowledge cutoff date の後に行われた今年の試験問題でもこの性能です
ぜひ論文をチェックしてください: https://t.co/uWWtdw6fdb pic.twitter.com/4ldIjYWq5U
特徴:
o1-previewは特に申請書作成や論文のIntroductionやDiscussionセクションの作成に優れた性能を発揮します。また臨床における鑑別診断の列挙にも力を発揮します(絞り込みは自分でやってください)。このあたりのタスクはClaudeよりも優れた結果を得られることが多いです。また、Advanced Voice Modeは実践的な英会話練習のツールとして非常に有用です。これらの特徴がChatGPTを課金して使用している主な理由になっています。自分で作成したGPTは実はあまり使用しておらず、ClaudeのProjectsを使うことが多いです。もしくはその都度タスクに応じた指示を出しています。
3. Gemini 1.5 Pro(無課金)
主な用途:
文献検索結果の抽出・整理
長文処理タスク全般(例:全文を通した英文校正、投稿規定確認)
NotebookLMの代替(NotebookLMよりもGeminiの方が出力形式が自由なのでNotebookLMはあまり使わなくなった temperature=0設定推奨)
メール返信(ChatGPT研究所さんの有料記事参照ください)
特徴:
長文の処理能力が高く、特に文献検索結果の要約や分析に適しています。論文全体をチェックする際に非常に有効です。GoogleAI Studio経由だと無料で使えて高性能な点が特徴です。
4. Elicit(無課金)
主な用途:
文献検索の初期調査
臨床上の疑問解決
特徴:
学術論文に特化した検索機能を持ち、系統的なレビューや文献調査の初期段階で特に有用です。
5. Perplexity(無課金)
主な用途:
一般的な調べ物(学術的な調査についてはElicitを優先的に使用)
特徴:
一般的な情報検索に優れていますが、より専門的・学術的な調査にはElicitを使用することを推奨します。文献の選定はElicitより精度が低く、回答内容と引用の内容が一致しないことが時々見られます。しかし、スマホアプリがあることや、結果の表示がElicitより早い点で手軽さはPerplexityが上です。また、疾患の画像所見の検索にも便利です。
6. ImageFX(無課金)
主な用途:
プレゼンスライドの挿絵作成
特徴:
スライドのビジュアルを向上させるために、挿絵の生成に使用しています。無課金で利用できる点がメリットであり、研究や発表用のスライドに効果的な画像を簡単に作成できます。以前より生成拒否が少なくなった印象があります。
まとめ
各AIツールには得意分野と特徴があり、タスクの性質に応じて使い分けることで効率的な研究・臨床活動が可能になります。
注意点:
本記事の内容は2024年11月時点での個人的な使用経験に基づくものです。
AIツールの性能や機能は頻繁にアップデートされるため、実際の使用時には最新の情報を確認することをお勧めします。
ChatBot Arenaなどのベンチマークは参考程度に留め、実際の業務での使用感を重視することをお勧めします。
臨床補助での使用については、引用元の文献をきちんと読んでください。
統計解析でのChatGPTのCode Interpreterの使用は基本的な分析に限定することを推奨します。