EHRを活用した医療研究の可能性
大規模データの活用がもたらす研究の発展
電子健康記録に代表される医療ビッグデータの活用によって、これまで困難だった大規模かつ長期的な観察研究が可能となりました。例えば、国民健康保険データや病院の電子カルテには、数百万〜数千万規模の患者情報が蓄積されています。これらを解析することで、従来の臨床試験では捉えきれない稀な副作用の発見や、長期間の追跡が必要な疾患リスクの解明が進んでいます。大規模データ解析により、患者集団全体の傾向やパターンを統計的に明らかにする「リアルワールドエビデンス(Real World Evidence)」の創出が可能になりつつあります。これは新薬の安全性評価や医療政策の立案などにも活かされ、エビデンス創出の形態が多様化しています。
さらに、多様なデータソースを結びつけられる点もEHR研究の強みです。電子カルテの診療記録だけでなく、処方箋データ、検査結果、画像データ、さらには遺伝情報やライフスタイル(ウェアラブル端末のヘルスデータなど)まで、異なるデータを統合して解析することで疾患の要因解明や個別化医療に向けた知見が得られる可能性があります。コンピュータ技術と統計手法の発展により、かつては処理困難だった膨大なデータも解析できるようになってきました。こうした**「ビッグデータ時代」**において、医学研究者は新たな発想とアプローチでデータに向き合うことが求められています。実際、著名な疫学者であるLiam Smeeth教授(ロンドン大学衛生熱帯医学大学院)は「新しいデータから最大限の価値を引き出すには、これまでにない創造性(イノベーション)が必要だ」と強調しています。従来の方法にとらわれず、柔軟に研究デザインや分析手法を工夫する姿勢が、大規模データ時代の研究には不可欠だと言えるでしょう。
医療ビッグデータが活躍した研究事例
医療ビッグデータの威力を示す具体的な研究例として、MMRワクチンと自閉症の関係をめぐる大規模検証があります。1998年に発表されたMMRワクチン(麻疹・おたふく風邪・風疹混合ワクチン)と自閉症の関連を示唆する論文は大きな物議を醸し、一時期ワクチン接種率の低下を招きました。しかしその後、各国で大規模な疫学研究が行われ、その関連は否定されています。例えば、イギリスの研究チームは約1300人の自閉症と診断された子供の電子診療記録と、約4500人の対照児のデータを解析し、MMRワクチン接種歴との関連を調べました (No link found between MMR and autism in large comprehensive MRC study | LSHTM)。その結果、MMRワクチンを接種した子供で自閉症のリスクが有意に増加する傾向は見られず、追加解析や過去の研究との統合的な検討でも一貫して「MMRと自閉症に因果関係は認められない」という結論が得られました (No link found between MMR and autism in large comprehensive MRC study | LSHTM) (No link found between MMR and autism in large comprehensive MRC study | LSHTM)。このようにEHRを用いた大規模データ研究により、社会に広まった医療上の不安が科学的に検証され、誤解が解消されたのです。Smeeth教授自身もこの研究に参加しており、「本研究はこれまでで最も堅牢かつ包括的な検討であり、MMRが自閉症リスクを高めないことを保護者に示すものだ」と述べています (No link found between MMR and autism in large comprehensive MRC study | LSHTM)。この事例は、ビッグデータが公衆衛生上の重要課題に迅速に答えを出しうることを示す好例でしょう。
もう一つの例は、COVID-19パンデミックにおけるリスク因子解析です。2020年、新型コロナウイルス感染症が世界的流行となる中で、「どのような人が重症化しやすいのか」という緊急の問いに答えるため、大規模な電子健康記録データの解析が各国で行われました。イギリスでは、初期の段階で約1,700万人の医療データを用いた大規模コホート研究が実施され、COVID-19による入院や死亡のリスク因子が解析されています ( OpenSAFELY: factors associated with COVID-19 death in 17 million patients - PMC )。その結果、高齢であることや男性であること、糖尿病や重度の喘息などの持病があることが、COVID-19による死亡リスクを有意に高める要因として明らかになりました ( OpenSAFELY: factors associated with COVID-19 death in 17 million patients - PMC )。さらに、人種・民族による差異も指摘され、白人と比較して黒人や南アジア系住民でリスクが高いことが示されています ( OpenSAFELY: factors associated with COVID-19 death in 17 million patients - PMC )。これらの知見はパンデミック初期の医療資源配分や予防策(ハイリスク層への重点的な対策など)に大いに役立ちました。この研究では、英国のプラットフォーム**「OpenSAFELY」**が用いられています。OpenSAFELYは英国国民保健サービス(NHS)の電子診療記録の約40%に当たる数千万人分のデータにセキュアにアクセスし、研究者が分析を行える環境で、まさにパンデミック下で急遽構築・活用された仕組みです ( OpenSAFELY: factors associated with COVID-19 death in 17 million patients - PMC ) ( OpenSAFELY: factors associated with COVID-19 death in 17 million patients - PMC )。このように、逼迫した状況下でも電子健康データを最大限活用することで、迅速かつエビデンスに基づいた意思決定支援が可能となりました。
ビッグデータと医療研究:メリットと課題
上述のように、EHRを含む医療ビッグデータの活用は研究の地平を大きく広げています。従来は数百人規模で行われていた臨床研究が、今や数百万規模のデータ解析で補完・強化され、エビデンスの一般化可能性(外的妥当性)が飛躍的に向上しました。特に、介入研究(ランダム化比較試験)の厳密さでは捉えられない**「現実世界での患者の姿」**を反映できる点で、ビッグデータから得られる知見は貴重です。例えば、厳選された症例のみを対象とする臨床試験では分からないような、日常診療下での治療効果のばらつきや長期的な転帰、併用薬との相互作用などが明らかになることがあります。また、医薬品承認後の安全性監視(ファーマコビジランス)においても、EHRを用いたデータ解析が副作用シグナル検出に役立っています。これは患者や医療者にとって直接的な利益となり得るでしょう。
しかし一方で、ビッグデータ研究にはいくつかの固有の課題も存在します。まず、観察データである以上、交絡因子(confounders)の影響を常に考慮しなければなりません。患者の背景要因が結果に与える影響を排除するのは容易ではなく、ランダム化されていないデータ解析から因果関係を正しく引き出すには高度な統計手法や設計上の工夫が必要です (Summary of KUSPH Short Course on July 16, 2021 | Kyoto University School of Public Health)。例えば健康意識の高い人ほど予防接種を受ける傾向があり、そうした要因が解析結果をゆがめる可能性があります。また、データの質(Quality)の問題も見過ごせません。日常診療データには入力ミスや抜け、病院間での記録方法の違いなどがあり、そのまま解析すると誤解を招く恐れがあります (Summary of KUSPH Short Course on July 16, 2021 | Kyoto University School of Public Health)。従って、研究目的に応じたデータクレンジングやバリデーション(妥当性検証)が不可欠です。さらに、結果の再現性にも注意が必要です。ビッグデータ分析では統計的に有意な結果が得られやすい一方、それが他のデータセットや解析者によって再現できるか検証しなければ、科学的事実として信頼できません (Summary of KUSPH Short Course on July 16, 2021 | Kyoto University School of Public Health)。このような課題を踏まえ、次章では電子健康データ研究の質を高めるための11のステップを紹介します。これらはSmeeth教授が講演の中で提示したポイントであり、ビッグデータ時代に信頼性の高い研究を行う上で指針となるものです。一般の方にもわかりやすいよう解説しますので、研究者でない方も「より良い研究のために何が大事か」をぜひ一緒に考えてみてください。
より良い研究のための11のステップ
ここから先は
¥ 500
この記事が気に入ったらチップで応援してみませんか?