見出し画像

生成AIとジャーナルクラブ ChatGPT-4o編:第2回 臨床医学総説論文(ナラティブレビュー)の要約


主な対象者

本記事では、ジャーナルクラブの準備でどうしたらいいだろう?と迷われたり、時間がない!と思われている医師(研修医や専攻医を含む)をサポートするプロンプトを紹介しています。
ノーコードで出来る内容を扱っています。
#ジャーナルクラブ #抄読会 #ChatGPT-4o #プロンプト #総説論文 #研修医 #EBM

本記事の画像はAdobe Fireflyを用いて生成しました。

はじめに

先日、Claude 3を用いて総説論文(臨床医学のナラティブレビュー)の内容を要約するプロンプトを紹介しました。

5月13日(米国時間)にOpenAIが新モデルであるGPT-4o (oはomniの略)が公開されました。このモデルはGPT-4の進化版であり、テキスト、画像、音声などのマルチモーダル入力をネイティブにサポートしているのですが、それに加えて回答速度が大幅に上がっています。なお、無料版でも回数制限はあるもののGPT-4oを使用することは出来ます。

介入研究に関するプロンプトの記事はこちら。

この臨床医学総説論文についても、Claude 3で使用したプロンプトはChatGPT-4oでもほぼそのまま活用することが出来ます。

補足——GPT storeとの差異化  6/2追記

ChatGPTにおいては、GPT storeに論文要約のGPTsが数多く存在します。英語はもちろん、日本語で使えるものも多いです。
以下のものが最も良く利用されているようです(下記リンクは日本語版。英語版もあります)。

このGPTは非常に優れており、単純にPDFをアップロードするか、URLを貼り付けるだけで、抄録の内容の日本語要約、当該論文の新規性、将来への示唆まで一瞬で情報が得られます。

ここで紹介するプロンプトは、3〜5段階に手順が分かれて煩雑となりますが、以下の点で新規性や優れている点があると考えています。

  1. EBMのステップ4(自分の医療セッティングに当てはめるとどうかの考察)がある。

  2. 図表の解説(まだ改善点はありますが)がある。抄読会の準備をする研修医や若手医師には助けになると思います。

  3. chain of promptになっている(つまり細かく仕分けている)分、個々の記載はやや詳しくなっている。

以下、以前の記事に準じて進めていきます。

プロンプトの前に  ファイルの添付

ファイルの添付はプロンプトを書く前でも後でも良いですが、その際の注意点です。
添付できるファイルにはサイズの上限がありますが、1個あたり512Mbまで(あるいは200万トークンまで)と、Claude 3より大幅に余裕があります。普通の論文1篇なら全く問題ないでしょう。
ただ、繰り返し利用していると、1エンドユーザーあたり10GBが上限となる点には注意が必要です。

https://help.openai.com/en/articles/8555545-file-uploads-faq

また、Claude 3で見られた、ファイル名にセミコロン(;)があると添付できない問題は、ChatGPTでは見られません。

プロンプト① 役割付与と導入

(ここから)
#あなたは経験豊富で教育能力にも優れた専門医です。
#添付したファイルの内容を、教育効果を最大化する目的でまとめてください。
#以下の指示を実行して下さい。2〜5については、200〜300字程度で要約してください。

  1. タイトルと抄録を日本語に翻訳してください。

  2. 総説の目的と範囲: 著者が何を明らかにしようとしているのか、どの範囲の研究を対象としているのか。

  3. 研究の選択基準: 著者がどのような基準で研究を選択し、レビューに含めたのか。

  4. エビデンスの質: 含まれる研究のデザイン、サンプルサイズ、バイアスのリスクなどを評価し、エビデンスの質を判断する。

  5. 結果の一貫性: 含まれる研究の結果が一貫しているか、異なる結果が報告されている場合はその理由は何か。

(ここまで)
まずはAIに役割を与えます。ここでは「臨床経験豊富で教育能力にも優れた専門医」で「論文査読にも優れてい」ると規定します。こうすることで頼れる専門医として振る舞ってくれます。

タイトルと抄録の日本語訳は定番ですね。
以下、総説論文の目的や範囲をはじめ、どのようにその総説論文が書かれ、そこで用いられているエビデンスの質について検討します。あるいはここまでくどく記載しなくても良いかもしれないです。

次のプロンプトに進みます。

プロンプト② 内容の中核に踏み込む

#続けて、以下の指示も実行してください。1は全体で800〜1200字程度で要約してください。3は200〜300字程度で要約してください。
(ここから)

  1. 臨床的意義: 内容が臨床実践にどのような影響を与えるのかを具体的に述べてください。各項目について、該当があるものについては以下の点を含めて記載してください。該当がない場合は記載しないでください。

    1. 疫学やリスク因子: 罹患率、有病率、地域差、主要なリスク因子とオッズ比/リスク比

    2. 病態生理: 発症メカニズムの最新知見、遺伝・環境・免疫の関与

    3. 臨床症状: 典型的症状、症状の多様性、症状と病型・重症度との関連

    4. 診断法: 推奨される診断アルゴリズム、各検査の感度・特異度、新しい検査法の位置づけ

    5. 治療法: 各治療法のエビデンスレベル、適応、有効性と安全性、新薬の位置づけ

    6. 予後: 生存率、予後因子とそのハザード比、機能予後、再発率

  2. 私の施設でこの結果を適用するとどのような影響がありますか?私の施設は日本の(都市部, 郊外, 農村部, 離島 etc.)にある(高度急性期, 一般急性期, 亜急性期・回復期, 慢性期, etc.)を担当する(大学病院, 市中病院, 診療所, etc.)で、(自施設や診療科の特徴、多い患者層など)です。

  3. 限界と今後の課題: 現時点で明らかになっていないこと、今後の研究課題について。

(ここまで)
2.の括弧内には、当てはまる医療機関の特徴を入力します。例えば私の勤務先だと以下のような形が考えられます。
「私の施設でこの内容を適用するとどのような影響がありますか?私の施設は日本の都市部にある400床の一般急性期〜亜急性期を担当する市中病院で、入院患者の大多数が75歳以上の高齢者です。」
この部分は、EBMの5つのステップの4番目である「この情報を自分の患者に適用できるか?」を踏まえたもので、医療機関のセッティングにより代用しています。

以前にも書いた注意点について繰り返しますが、生成AIには一般的に個人情報や企業情報をそのまま入力すると学習材料として利用されてしまう恐れがあります。上記のような一般的な表現に留めた方が良いでしょう。

1.1〜1.6は、臨床医学の総説論文にも色々あって、どの部分を強調したものかは論文により異なっています。その論文の目的や範囲に応じて項目を絞って、より詳細なプロンプトを書くことも出来ますが、今回は、汎用性を持たせて6項目を掲載しています。これ全体で800〜1200字程度と、日本語で内容の深みを多少とも感じ取れる範囲で、長くなり過ぎないことを意図しています。正直、字数は逸脱することも多いですが大目に見てください。
3.は総説が書かれた時点で、そのテーマについてまだ分かっていないことに焦点を当てています。

この次に、順不同で図や表に関するプロンプトを入力すると、有用な情報が得られます。AppendixやSupplementに関する情報は、Claude 3 Sonnetだとあるはずの図や表を無いと言われることもあるのですが、その点はChatGPT-4oの方がやや正確です(それでも不十分となることもあります)。

なぜか、プロンプト②で指示した自施設での適用に関する回答を繰り返すこともあり、「#私の施設での適用については、繰り返さなくて良いです。」などと、この段階で指示した方が無難です。

それでは最後のプロンプトです。ここはWeb検索が可能なChatGPTの強みが活きるところです。

プロンプト③ Take Home Messageを得る

(ここから)
#続けて、以下の指示も実行してください。

  1. 特に持ち帰るべき学びのポイントを3,4個の箇条書きにまとめてください。

  2. この論文のキーワードを5つ、ハッシュタグをつけて提示してください。

  3. 更に学びたい人へ、おすすめの論文を3~5個挙げてください。挙げた論文一つひとつに対して、特徴を一文で記載してください。半分以上の論文を、本論文の発表から5年以内のものから選択してください。引用文献以外の論文を、少なくとも1つは必ず含めるようにしてください。バンクーバー方式でお願いします。

  4. この論文をデータベースに保存したいです。バンクーバー方式で記載してください。

(ここまで)

この部分は介入研究の要約プロンプトとほぼ同様の内容です。ナラティブレビューにそぐわない診療ガイドラインを変えるインパクトがあるかどうかの問いを省略したのみです。
ChatGPT-4oを使用した場合、Web検索が可能ですので、引用文献以外の論文でもお勧めの内容のものを素早く検索して提示してくれます。これは、Claudeと比較した場合の大きな強みとなります。

終わりに

ここまでのプロンプトを用いることで、ものの数分でジャーナルクラブの発表の骨格が出来上がります。あとは細かい部分の原文との整合性の確認をやったり、必要な図表を用意するなどすれば十分でしょう。ChatGPT-4oはそれまでのChatGPTのモデルより数段優れており、今回の条件なら概ね信頼できるのですが、最後の確認は人間が行う必要があります。その点は忘れないようにしてください。

3つのプロンプトを1つにまとめて一発で要約を作成することも可能ですが、個々の記載のクオリティが低下し、ハルシネーションが出現する場合があるため上記のように①〜③のステップ・バイ・ステップとしました。

最後までお読みいただき、ありがとうございました。
今後とも有益な情報を発信していきますので、応援よろしくお願い致します。
他の内容についても、随時ChatGPT-4oでの使用感を含めて紹介していきます。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?