ChatRadio-Valuer: A Chat Large Language Model for Generalizable Radiology Report Generation Based on Multi-institution and Multi-system Data
本研究の学術的背景や研究課題の核心をなす学術的「問い」は、放射線科のレポート生成における一般化の問題です。放射線科のレポートは、医療機関や放射線科医、検査された体の部位によってスタイルや規範性が大きく異なるため、大量のデータを扱う現行の方法にとって、これらのレポートの複雑さと多様性は大きな一般化の課題となっています。
本研究の目的は、放射線科のレポート生成における一般化の問題を解決することです。そのために、我々は大規模言語モデル(LLM)を基にしたChatRadio-Valuerというモデルを提案します。このモデルは、一般化可能な表現を学習し、複雑な分析者のケースでのモデル適応の基本パターンを提供します。また、本研究の学術的独自性と創造性は、放射線科のレポート生成における一般化の問題に対する新たな解決策を提供することにあります。
本研究の着想は、放射線科のレポート生成における一般化の問題を解決するための新たなアプローチが必要であるという認識から生まれました。また、関連する国内外の研究動向としては、大規模言語モデル(LLM)の登場があります。これは、健康状態の兆候を認識するための大きな可能性を提供しています。本研究は、このLLMを基にした新たなモデルを提案することで、放射線科のレポート生成における一般化の問題を解決しようとしています。
本研究では、ChatRadio-Valuerという新たなモデルを提案し、その有効性を検証しました。具体的には、このモデルは、一つの医療機関からの放射線科のレポートを基に訓練され、その後、6つの異なる医療機関からの人間の多系統評価(つまり、胸部、腹部、筋骨格系、頭部、口腔顔面頸部)の疾患診断タスクに適応されました。この研究で使用された臨床データセットは、合計で332,673の観察を含んでいます。エンジニアリング指標、臨床効果、デプロイメントコストメトリクスに基づく包括的な結果から、ChatRadio-Valuerが放射線科のレポートからの疾患診断において、特にChatGPT(GPT-3.5-Turbo)やGPT-4などの最先端のモデルを一貫して上回ることが示されました。
本研究の有効性は、実際の放射線科のレポートを用いた実験によって検証されました。具体的には、中国の第二湘雅病院の臨床パイプラインからの実際の放射線科のレポートを用いて実験を行い、その結果から我々の方法の優位性が明らかになりました。