Extracting detailed oncologic history and treatment plan from medical oncology notes with large language models
本研究の学術的背景,研究課題の核心をなす学術的「問い」は?
本研究では、患者の病気の進行状況や治療経過を記録した臨床ノートには、医療のケアや観察研究に必要な重要な情報が記載されているが、現在のがん情報表現と注釈スキーマのどのスキーマも、これらのノートに記録された情報の多様性を十分に網羅していないという課題に取り組んでいます。
本研究の目的及び学術的独自性と創造性は?
本研究では、がん情報表現や注釈スキーマの課題を克服するために、臨床ノート内のがん情報を詳細に注釈付けを行うスキーマを提案し、3つの大規模言語モデル(GPT-4、GPT-3.5-turbo、FLAN-UL2)を使用して、臨床進行ノート内のがん情報を抽出する能力を評価しました。3つのモデルのうち、GPT-4モデルが最高の性能であり、患者特徴、腫瘍特徴、医薬品の抽出能力に優れ、がんによる症状の推論や将来の治療考慮事項に対する優れたパフォーマンスを示した点が独自性と創造性といえます。
本研究の着想に至った経緯や,関連する国内外の研究動向と本研究の位置づけは?
近年、自然言語処理技術が医療分野において注目を集めています。しかし、がん治療についての十分にアノテーションされたデータセットがないため、大規模言語モデルを用いた臨床進行ノートのがん情報抽出の評価が不十分であったという課題がありました。本研究では、臨床ノート内のがん情報を詳細に注釈付けを行うスキーマを提案し、大規模言語モデルを用いて、がん情報を抽出する能力を詳細に評価しました。
本研究で何をどのように,どこまで明らかにした?
本研究では、臨床進行ノート内のがん情報を詳細に注釈付けしてスキーマを作り、3つの大規模言語モデル(GPT-4、GPT-3.5-turbo、FLAN-UL2)を用いて、がん情報の自動抽出能力を評価しました。
本研究の有効性はどのように検証した?
GPT-4は、複雑なタスクの平均精度が67%、平均BLEUスコアが0.69、平均ROUGEスコアが0.72で、患者特徴、腫瘍特徴、医薬品抽出能力に優れ、がんによる症状の推論や将来の治療考慮事項に対する優れたパフォーマンスが確認されました。本研究の結果は、がん臨床進行ノートから重要な情報を抽出し、クリニカルリサーチや質の高い患者ケアの文書化のための有用な補助ツールとして大規模言語モデルが有望であることを示唆しています。