医療(EHR)/健康(PHR)情報とは?
1.まえがき
皆さんが病院で診療を受けたり、体調不良で検査を受けたりしたとき、その診療記録や検査結果は受診した医療機関ごとにカルテ(診療記録)として保存されます。さらに、処方された薬の情報や、他の医療機関を利用した際の記録も、すべてそれぞれの場所で管理されています。このため、患者が複数の医療機関で診療を受けている場合、自身の健康情報が複数の場所に分散されているのが現状です。
2.なぜInsightXのような情報集約が必要か?
諸外国に遅ればせながら、日本でも医療と健康分野におけるデータ活用を強化するため、ICT(情報通信技術)を積極的に導入し、次の3つの重点的な取り組みを進めています。
電子カルテ(EHR)の普及と相互連携
医療機関ごとに分散している診療記録(カルテ)や検査結果をデジタル化し、患者の医療データを効率よく共有する体制を構築しています。電子カルテの普及により、医療機関同士が必要な情報を迅速に共有でき、患者の転院や複数の医療機関での治療がスムーズに行えるようになります。これにより、診療の質が向上し、医療の効率化にもつながります。オンライン診療の推進
特に新型コロナウイルスの流行を機に、オンライン診療が広がりつつあります。オンライン診療は、遠隔地や通院が難しい患者にも診療機会を提供し、医療アクセスの向上に貢献しています。ICTを活用した遠隔診療の拡充は、医療サービスの効率化と患者の利便性向上に重要な役割を果たしています。個人健康記録(PHR)システムの導入
Apple Watchなどのウエラブルデバイスで集めた健康管理データなどをはじめとする個人の健康や医療情報を一元的に管理する「PHR(Personal Health Record)」の導入が進んでいます。患者自身が自分の医療データや服薬情報、生活習慣などを確認・管理しやすくすることで、自己管理能力の向上や医療従事者とのコミュニケーションを円滑にします。また、PHRは医師が患者の健康全体を把握するのに役立つため、より適切な治療や予防措置を取ることが可能となります。
3.リアルワールドデータ
世界的な医療データのデジタル化が進んだせいかリアルワールドデータの話を最近良く耳にします。
ではいったいリアルワールドデータとはどんな医療/健康情報のデータなのでしょうか?
リアルワールドデータ(Real-World Data, RWD)とは、臨床試験以外の現実の医療や日常生活から収集されるデータのことです。このデータは、医薬品の効果や安全性の評価、医療技術の改善、患者のケア向上などに利用され、医療や製薬、政策立案において重要な役割を果たします。
3-1. リアルワールドデータの特徴
現実の医療環境で得られるデータ:臨床試験は条件が厳しく管理されているのに対し、RWDは現実の医療環境や患者の日常生活から取得されるため、日常の中でどのように薬や治療が効果を発揮するかについての情報を得ることができます。
多様な情報源:RWDは、電子カルテ(EHR)、健康保険の請求データ、患者が使用するウェアラブルデバイスや健康管理アプリ、病院のレジストリ(登録システム)、さらにはソーシャルメディアや患者報告アウトカム(PRO)などから収集されます。
長期的かつ広範囲なデータ:臨床試験は短期間のことが多いですが、RWDは長期にわたり多くの患者のデータを蓄積できるため、長期的な効果や副作用の評価が可能です。
3-2. リアルワールドデータの活用例
RWDは、以下のような目的で広く活用されています。
医薬品の効果と安全性の評価:RWDは、市販後の薬や治療法がどのように効果を発揮しているかを実際の患者データから確認するために使われます。例えば、新薬の実際の使用状況における効果や副作用をモニタリングし、リスクが見つかれば早期に警告や対策を講じることが可能です。
治療方法の最適化:さまざまな患者の実際の治療結果を分析することで、効果的な治療法を特定したり、治療の個別化(パーソナライズドメディスン)に役立てたりすることができます。
医療経済や医療政策の意思決定:RWDは、医療資源の最適な配分や、コスト効率の良い治療法の評価など、医療経済に関する分析に用いられます。また、政策立案者にとっても、患者ケア向上や公衆衛生の改善のためのエビデンスとして活用されています。
3-3. リアルワールドデータの例
RWDの具体的な例には、次のようなものがあります:
電子カルテ(EHR):医師が患者の診療記録を保存するためのシステムで、診断、治療、投薬、検査結果などの詳細な情報が含まれます。
保険請求データ:保険会社や国民健康保険システムに提出されるデータで、治療や薬剤の使用、診療費用などが記録されています。
患者報告アウトカム(PRO):患者が自身の症状や生活の質、治療の満足度などを自己報告するデータです。患者自身の視点が反映されるため、主観的な側面も含めて評価が可能です。
ウェアラブルデバイスや健康アプリからのデータ:スマートウォッチやフィットネスアプリから取得できる心拍数、活動量、睡眠パターンなどのデータは、生活習慣の管理や健康状態の変化の把握に利用されます。
3-4. リアルワールドデータの利点と課題
3-4-1. 利点
大規模で多様なデータ収集:臨床試験では網羅しきれないような、さまざまな患者属性や病歴、生活習慣に基づくデータを収集できるため、治療の実際の有効性を評価できます。
長期的なフォローアップ:治療の長期的な効果やリスクを評価できるため、慢性疾患の治療や予防に役立ちます。
意思決定の改善:リアルなデータに基づく分析結果は、医療提供者や政策立案者にとって貴重なエビデンスとなります。
3-4-2. 課 題
データの品質とバイアス:データの正確性や一貫性が欠けている場合があり、偏りや欠損が生じやすいです。
プライバシーとセキュリティの問題:患者の個人情報を扱うため、データの保護が重要です。匿名化などの対策が必要です。
標準化の欠如:異なる医療機関やシステムでデータ形式や内容が異なることが多いため、データの標準化が求められます。
3-5. リアルワールドエビデンス(RWE)との関係
RWDを分析して得られる「実世界のエビデンス」をリアルワールドエビデンス(Real-World Evidence, RWE)と呼びます。RWEは、RWDを用いて得られる医療行為や薬の効果に関する証拠であり、新薬の承認や治療法の評価において重要な役割を果たします。FDA(米食品医薬品局)やEMA(欧州医薬品庁)などの規制機関もRWEを活用する方向に進んでおり、今後の医療政策や承認プロセスにおいてさらに重視されることが予想されます。
4.EHRとPHR将来のデータ量の予想
電子健康記録(EHR: Electronic Health Record)と個人健康記録(PHR: Personal Health Record)のデータ量は、デジタル医療が普及し続ける中で急速に増加すると予想されています。この増加には、医療データのデジタル化、ウェアラブルデバイスの普及、遠隔医療の進展、そしてAI解析のためのデータ需要が大きく影響しています。以下に、将来のEHRとPHRのデータ量に関する予測とその要因を解説します。
4-1. EHRの将来のデータ量予測
EHRのデータ量は今後10年間で爆発的に増加すると予想されています。アメリカだけでも、2020年から2025年までに医療データの量が2倍以上になるとされ、以下の要因がこの増加に寄与しています。
人口増加と高齢化:高齢化社会の進展に伴い、医療利用者数が増加します。特に高齢者は慢性疾患を抱えることが多く、EHRに記録されるデータ量が増える要因となります。
医療データのデジタル化と包括的管理:医療機関は、画像データ(CT、MRI、X線など)、診療記録、検査結果、投薬情報などをEHRに含めるようになっています。これにより、従来のテキストデータだけでなく、容量の大きい画像データが蓄積されるため、データ量が急増します。
AIと解析技術の進展:EHRデータを基にしたAI解析や機械学習が普及すると、診断や治療の高度化に貢献する一方で、データを長期間にわたり保持する必要が生じます。また、AI解析用のメタデータやラベル付けされたデータも増加し、EHRデータ量がさらに増えることが予想されます。
4-2. PHRの将来のデータ量予測
PHRは、個人がウェアラブルデバイスやスマートフォンアプリなどを通じて日常的に記録する健康データを含むため、日々のデータ量が大きく、今後も急成長すると考えられます。以下の要因がPHRデータの増加に寄与します。
ウェアラブルデバイスの普及:ウェアラブルデバイス(スマートウォッチ、心拍数モニター、血糖値センサーなど)やスマートフォンアプリで収集されるデータがPHRに蓄積されるため、個々のデータ量が増加します。毎日・毎時間単位でのデータ収集により、年間にすると膨大なデータ量が生成されます。
健康管理のデータ拡張:睡眠データ、運動データ、ストレスレベル、血圧など、さまざまな健康指標がPHRに含まれ、従来の医療データに加えて個人のライフスタイルに関わる情報も蓄積されるため、データ量が膨らみます。
個別化医療とゲノムデータ:個人のゲノムデータやDNA分析などもPHRに含まれることが増えつつあり、これがさらなるデータ量の増加を招きます。ゲノムデータは非常にデータ量が大きいため、広く普及するとPHRのデータ量も飛躍的に増加するでしょう。
4-3. 将来の具体的なデータ量予測
以下は、具体的な数値の予測です。これらの数値はあくまで参考であり、技術進展やデータ管理のルールの変化により前後する可能性がありますが、いくつかの調査や報告から見えている傾向です。
EHRデータ量:現在のEHRのデータ量は数百テラバイト規模の病院も珍しくありませんが、10年以内にはペタバイト(1ペタバイト=1000テラバイト)単位のデータ量に達する施設が増加すると予想されます。医療全体では、2025年頃にはグローバルでの医療データが2,300エクサバイト(1エクサバイト=100万テラバイト)を超えるとの見方もあります。
PHRデータ量:個人レベルでは、1人の年間PHRデータが数ギガバイト程度に達する可能性があり、特にウェアラブルデバイスからのリアルタイムデータが頻繁に収集されることで膨らんでいきます。人口規模で見ると、2030年までには数百エクサバイト規模に達するとも予想されています。
4-4. データ増加に伴う課題
EHRとPHRのデータ増加により、いくつかの課題が生じます。
ストレージと管理コスト:データ量の増加により、データストレージの確保が重要な課題になります。クラウドストレージの利用が進む一方で、データ管理やセキュリティのコストが増加する可能性があります。
プライバシー保護とセキュリティ:個人の医療データや健康データの保護が一層重要になります。特に、PHRのデータにはライフスタイルやバイオメトリクスなどのデリケートな情報が含まれるため、データ保護のための高度な対策が必要です。
データの統合と標準化:EHRとPHRのデータ形式や管理方法が異なるため、これらを効率的に統合するための標準化が求められます。標準化によって、医療機関と個人がデータを共有しやすくなり、診療の質向上に貢献できます。
EHRとPHRのデータ増加は、医療の質や個人の健康管理の向上に寄与する一方で、これらを効率的に扱う技術やインフラが必要です。
5.日本のリアルワールドデータとは(NDB-厚労省所管)
厚生労働省が管理するNDB(National Database of Health Insurance Claims and Specific Health Checkups of Japan)は、日本の医療保険請求データや特定健診データなどを収集し、医療の質向上や医療費の適正化を目指した国家レベルのデータベースです。このデータは、研究や政策立案などに活用されており、アクセスには申請手続きが必要です。
5-1. NDBデータの種類と提供対象
NDBに収集される主なデータは次の通りです:
医療保険請求データ:診療内容や薬剤、医療費の情報
特定健診データ:主に生活習慣病予防のための検診データ
その他の健康保険関連データ:介護サービスなどの情報
NDBのデータは、医療・保健分野の研究者や医療機関、公共政策を担う政府関係者などに向けて提供されることが一般的です。一般の個人はアクセスが制限されており、基本的にデータ提供の対象外です。
5-2. NDBデータへのアクセス方法
NDBにアクセスし、データを利用するには厚生労働省への申請が必要で、申請は以下のプロセスに従います。
ステップ1: 利用申請の準備
まず、NDBデータをどのような目的で、どのデータをどの範囲で利用するのかを明確にします。NDBへの申請には、具体的な研究目的や分析の必要性を説明する必要があります。また、データを用いた研究計画や、倫理的な配慮がされていることを示す文書も必要です。
ステップ2: データ利用許可の申請
利用申請は厚生労働省の担当部署に書類を提出することで行います。申請に必要な書類は以下の通りです:
利用申請書:データの利用目的や利用範囲などを記入する書類
研究計画書:研究の概要や、NDBデータがどのように活用されるかを説明する計画書
倫理審査委員会の承認:研究内容が倫理的に問題ないと判断されるための審査を受け、承認された証明書
これらの書類を整え、申請書を提出します。
ステップ3: 審査と承認
厚生労働省の審査委員会が、申請内容をもとにデータ利用の可否を判断します。審査では、データの利用目的が適切か、倫理的に問題がないか、データの機密性が適切に保護されるかが確認されます。この審査には時間がかかることがあり、場合によっては数週間~数ヶ月の期間が必要です。
ステップ4: データの提供と利用開始
審査が通れば、NDBのデータが提供されます。データは通常、匿名化された状態で提供され、セキュリティが確保された環境での利用が求められます。また、データの利用期間や利用方法には制約があり、指定された範囲内での利用が義務付けられています。
5-3. データの利用にあたっての注意事項
NDBデータは個人情報を含む機密性の高いデータであるため、利用に際して以下の注意が必要です:
データの匿名化:データには個人情報が含まれており、通常は匿名化された状態で提供されますが、厳重に取り扱う必要があります。
データの再提供・二次利用の制限:提供されたデータを第三者に再提供することは禁止されています。また、申請時に許可された利用目的以外での使用も禁止されています。
報告義務:利用したデータを基にした研究成果は厚生労働省に報告する必要がある場合があります。
5-4. 参考情報
NDBの利用方法や申請書類の詳細は、厚生労働省のウェブサイトや、NDBオフィス(厚生労働省が設置したデータ提供を担当する部署)で案内されています。NDBのデータ利用手順や規定については、定期的に更新されることがあるため、最新情報を確認することが重要です。
6.MID-NET
MID-NET(Medical Information Database Network)は、日本国内の23の医療機関から収集した電子カルテ、レセプトデータなどを集積した医療データベースで、主に医薬品の安全性を評価するためのリアルワールドデータとして活用されています。
MID-NETはやはり厚生労働省が管理しており、医薬品の有効性や副作用リスクの評価、さらには新薬の承認後調査などで使用されています。
7.てんかん発作予知にリアルワールドデータは使えるの?
NDBやMID-NETのデータは、主に医薬品の安全性評価や医療政策の策定を目的としたリアルワールドデータの分析に利用されるものであり、てんかん発作予知のシステム開発にはそのままでは直接的なデータとして適していない可能性があります。ただし、これらのデータベースから得られる情報を活用することで、てんかん発作予知システムの開発や評価に役立つ側面もあります。
7-1. NDB・MID-NETとてんかん発作予知のデータの違い
前述のようにてんかん発作予知のシステムにおいては、発作の発生前の生体信号(脳波、心拍、呼吸など)をリアルタイムでモニタリングすることが重要です。NDBやMID-NETは主に以下のようなデータを含むため、リアルタイムでの発作予知に必要なデータとは異なります。
NDB:医療保険の請求データや特定健診データが主であり、診断や治療、薬の処方に関する情報が収集されます。
MID-NET:電子カルテや医療レセプトの情報で、医療行為や治療内容、患者の診断履歴が主なデータ内容です。
これらは、発作前の生体モニタリングや瞬時の異常検出といったリアルタイムの信号データ(例:EEG脳波、心拍変動、皮膚電気反応)を含んでいないため、発作予知そのものに直接活用することは困難です。
7-2. NDB・MID-NETがてんかん発作予知システムに間接的に役立つ可能性
てんかん発作予知のシステム開発には、以下のような間接的なサポートが考えられます。
てんかん患者の臨床情報や治療パターンの分析: MID-NETやNDBには、てんかん患者の診断や治療経過、投薬履歴などが記録されています。これらを分析することで、てんかん患者の発作頻度や重症度、併用薬などの統計情報を把握できます。これにより、発作予知システムの対象となる患者層や、そのシステムが想定すべき状況を把握しやすくなります。
医薬品の有効性や副作用の評価: MID-NETには、てんかん治療薬に関するデータが含まれているため、どのような薬が有効であるかや、副作用が発作予知にどう影響するかといった情報も得られます。これにより、発作予知システムを使用する患者の薬物療法の傾向や、それに伴うリスクを考慮したシステム設計が可能になります。
患者の背景やリスク因子の特定: NDBの特定健診データを利用すれば、てんかん発作に関わる可能性のある生活習慣病(例:高血圧、肥満、糖尿病)や合併症を持つ患者がどの程度いるかを把握することができます。こうしたリスク因子のデータは、発作予知システムが特定の健康状態を持つ人に対してどのように設計されるべきかの指針になります。
7-3. てんかん発作予知システムのために必要なデータの例
てんかん発作予知システムに必要なデータは、以下のようにリアルタイムで得られる生体信号のデータが中心です。
脳波(EEG):脳活動の変化をリアルタイムで把握するために不可欠です。特に発作の兆候となる波形変化があるかを監視します。
心拍や呼吸などの生理学的データ:発作の兆候として心拍数や呼吸パターンが変動する場合があるため、心電図(ECG)や呼吸データも重要です。
皮膚温度・皮膚電気反応(EDA):発作の予兆に伴う自律神経の変化を検出するのに役立つ場合があります。
これらのデータは、ウェアラブルデバイスや医療機関内で取得できるモニタリングシステムが提供するリアルタイムのデータである必要があります。NDBやMID-NETではこれらのデータは取得できないため、別途のデータ収集が求められます。
7-4. 今後の方向性
NDBやMID-NETのデータが今後、リアルワールドエビデンスとして多くの研究分野で活用される中、てんかん発作予知システムと組み合わせた活用方法も模索されるかもしれません。特に、臨床情報とリアルタイムの生体データを統合する研究が進めば、より包括的な発作予知システムの基盤が形成される可能性があります。また、これらのデータとウェアラブルデバイスのデータを統合して機械学習モデルの学習に用いることで、発作予測精度が向上することが期待しています。