セキュアにパーソナルデータを分析できる!?企画中のデータ分析ソリューションをご紹介!
この記事は以下の方に特におすすめです!
・パーソナルデータを活用した分析や研究に取り組まれる方(ex 医療介護・金融・B2Cなどの事象者の方)
・データを活用したDXを推進されている方
パーソナルデータ(個人情報)を分析する際の課題
・第3者に分析を依頼する場合、データの受け渡しや、受け渡し後のデータの厳重な管理、監視が求められる
・仮名加工や匿名加工などデータ提供側の負担
・受け渡しが行えない場合は、実際にデータを保有する現場で分析(サイトビジット方式)を行うなど、物理的な制約が発生すること(コストや工数も発生してしまう)
・複数のデータソースを分析対象にする場合、データを一度集約させる方式が一般的。その際、データのクレンジング、DWHの運用(コストや工数)などが課題に。
このような課題に悩まされるデータ提供者や分析・研究者の方はおられるのではないでしょうか?
コンテナ技術を活用したデータ分析ソリューション
GDPRの対策として、オランダやドイツを中心にヨーロッパでサービスが開始されているPersonal Health Train (以下PHT)をベースにしたデータ分析ソリューションを企画・検証しています。
基本的な処理方法
①データ提供元(医療機関など)に実データを配置し、計算リソースを準備し、データ提供元の管理下とする。(Station)
②データ利用者(研究機関など)はDocker内にアルゴリズムとクエリを設定する。(Train)
③TrainをStationに送信し、各Stationを巡回し、アルゴリズムやクエリを実行する。
④処理結果(分析結果や学習モデル)を含むTrainがデータ利用者に戻る。
まとめると、、
分析者自身が作成したRやPythonで書かれたプログラムを、各データソースの分析用データベースに接続して実行、解析し、解析結果等の結果を得ることができる!ということになります。
メリット
・データを分析者に受け渡す必要がないため、データ抽出や受け渡しに係る工数の削減やデータ漏洩リスクの軽減に寄与できます
・大規模なデータセットを効率的に処理することが可能となります
実証実験を開始!
今後の活動
本ソリューションは、リアルワールドデータを取り扱う、医療機関や研究機関、ヘルスケア業界などで利用が進んでいくのではないだろうか?と検討しております。
また、個人情報の分析は金融機関やB2Cの事業会社など様々なフィールドで行われているため、本ソリューションが活躍するフィールドが他にもあるのではと考え、調査を進めていきます。
現在、想定しているユースケース
・複数の医療機関を結ぶ臨床研究
・連携、提携企業間でのリモート分析
・管理対象の下部組織のデータを統計的に集計
お問い合わせはこちら!
本ソリューションにご興味があれば、お気軽にお問い合わせください!