Question Answering for Electronic Health Records: A Scoping Review of datasets and models
本研究の学術的背景や研究課題の核心となる学術的な問いは、Electronic Health Records (EHRs) 上のQuestion Answering (QA) システムがどのように臨床医師や患者の両方に役立つかということです。具体的には、臨床医師の意思決定を支援するだけでなく、患者が自分の医療史をより理解するためにも役立ちます。EHRには多くの患者データが保存されており、EHR QAは重要な研究領域となっています。
本研究の目的は、既存のEHR QAに関する研究を方法論的にレビューすることです。具体的な目的は、(i) 既存のEHR QAデータセットを特定し分析すること、(ii) このタスクで使用されている最新の手法を研究すること、(iii) これらの最新モデルで使用されているさまざまな評価指標を比較すること、および最後に (iv) EHR QAにおけるさまざまな課題と現在の問題を明らかにすることです。本研究は、将来の研究者が可能な未来の研究方向に焦点を当てるための手助けとなるでしょう。
本研究は、Google Scholar、ACL Anthology、ACM Digital Library、およびPubMedという4つのデジタルソースで2005年1月1日から2023年9月30日までの論文を検索し、EHR QAに関する関連する出版物を収集するために行われました。体系的な選定プロセスはPRISMAガイドラインに従って行われました。4111件の論文が特定され、対象基準に基づいて選定した結果、47件の論文が最終的な研究のために得られました。選択された研究は、それぞれ「EHR QAデータセット」と「EHR QAモデル」という2つの非相互排他カテゴリに分類されました。
本研究では、EHR QAに関する47件の論文の体系的な調査を行いました。そのうち25件はEHR QAデータセットに関するものであり、37件はEHR QAモデルに関するものでした。EHR上のQAは比較的新しく未開拓の領域であることがわかりました。ほとんどの研究は最近行われたものです。また、emrQAが最も人気のあるEHR QAデータセットであることもわかりました。また、EHR QAデータセットはそのモダリティに基づいて分類され、MIMIC-IIIとn2c2データセットが最も人気のあるEHRデータベース/コーパスであることが推測されました。さらに、EHR QAで使用されるさまざまなモデルとそれらのモデルに使用される評価メトリックスを特定しました。
本研究では、クリニカル注釈の入手が制約されている、EHR QAの中でもいくつかの課題が存在することが明らかになりました。具体的には、臨床注釈の限られた利用可能性、EHR QAでの概念の正規化、現実的なEHR QAデータセットの生成に直面する課題があります。EHR QAに関する研究にはまだ多くの課題が存在し、さらなる研究が必要です。本研究は、将来の研究者が可能な未来の研究方向に焦点を当てるための手助けとなるでしょう。
この記事が気に入ったらサポートをしてみませんか?