医家向けPHRデータの公開基準案
本日、今年最後のビデオ会議が開催されました。InsightXの試験運用において、欧州を中心にウェアラブルデバイスや診療データなどから収集したデータは、10TBのHDD換算で500個分を超えたとのことです。すでにクレンジング処理も完了しており、これらのデータを医師や研究者にどのように公開するかが来年の重要な課題となりそうです。
検索効率やユーザー体験を考慮した場合、インデックス化(またはカテゴリ化)とフリーワード検索を両立させるのが最適な方法であると私見では考えています。それぞれの方法の利点について検討するとともに、日本の医師が直面しているシソーラスに関連する課題にも触れながら、より具体的な解説を進めていきたいと思います。
1. インデックス化 / カテゴライズ化の利点
検索速度の向上: カテゴリー分けされたデータは、検索範囲を限定できるため、高速検索が可能です。
精度の向上: インデックス化により、検索結果の関連性が高まります。例えば、データを「疾患別」「年齢層」「治療法別」に分類すると、特定のケースを素早く特定できます。
視覚的なナビゲーション: カテゴリーごとにデータを表示すると、フリーワード検索を苦手とする人でも直感的に情報へアクセスできます。
シノニム(類義語)対応の補完: 日本人医師の間で、専門用語やシソーラスに対する知識がバラつく場合、あらかじめカテゴライズしておくことで、異なる言葉での検索を統一できます。
2. フリーワード検索の利点
柔軟性: インデックス化では対応しにくい自由な質問や未知の条件に対しても対応可能です。
検索習慣の適応: 一部の医師は詳細条件の選択を面倒に感じるため、簡単なフリーワード入力を好むことがあります。
自然言語処理(NLP)の進展: AIの力を活用することで、類義語や文脈を理解し、より正確な結果を提供できます。
3. 日本人医師とシソーラス
日本人医師がシソーラスを苦手とする可能性がある理由:
専門用語が英語ベース: 日本語で同義語や関連語を体系的に扱うことに慣れていないケースが多いです。最近日本糖尿病学会とJADEC(日本糖尿病協会)は糖尿病スティグマの除去を目的として、糖尿病の呼称を「ダイアベティス」とすることを提唱しましたが賛否両論でお隣り韓国と違って日本では英語名での病名や治療方法などはまだ馴染みそうにもありません。
忙しさから来る学習時間の不足: 日々の診療業務で、新しいツールや概念を学ぶ時間が限られています。
検索文化の違い: 日本では従来からキーワード検索が主流で、シソーラスや高度な検索構文を活用する習慣が薄いです。
4. 解決策: 両者のハイブリッド設計
以下のアプローチを採用すると、医師の検索体験を大きく向上させることができないか
4-1.インデックス化(カテゴリー設計)
カテゴリ例:
疾患(例: 糖尿病、てんかん)
年齢層(例: 小児、高齢者)
治療法(例: 薬物療法、手術)
デバイスデータ(例: ウェアラブル、バイタルサイン)
検索フィルター:
検索結果を「カテゴリ」「サブカテゴリ」で絞り込めるインターフェースを設置。
4-2.フリーワード検索 + NLP補助
類義語サポート: 同義語・類義語を自動的に解釈(例: 「発作」=「けいれん」)。
日本語と英語の両対応: 医師が英語で検索しても正確な結果を返す。
候補の提示: 入力時に関連するキーワードをサジェスト。
4-3.学習とサポート
ユーザー教育: シソーラスや検索機能を理解するための簡易ガイドを提供。
医師の検索行動分析: よく使われる検索パターンを学習し、UIや検索ロジックを最適化。
5. どちらを優先すべきか?
初期段階ではインデックス化を優先: 医師が使いやすい構造化データを提供することで、シソーラスの問題を緩和できます。
長期的にはAI検索エンジンを導入: フリーワード検索をNLPで強化し、シソーラスの課題を技術で解決します。
これにより、日本の医師にも馴染みやすい、高速かつ正確な検索体験を提供できると現時点では考えています。ただし、AI技術の進歩は日進月歩であるため、公開時点までにさらに優れた方式が登場することにも期待しましょう。