見出し画像

セキュアにパーソナルデータを分析できる!?企画中のデータ分析ソリューションをご紹介!

この記事は以下の方に特におすすめです!

・パーソナルデータを活用した分析や研究に取り組まれる方(ex 医療介護・金融・B2Cなどの事象者の方)
・データを活用したDXを推進されている方

パーソナルデータ(個人情報)を分析する際の課題

・第3者に分析を依頼する場合、データの受け渡しや、受け渡し後のデータの厳重な管理、監視が求められる
・仮名加工や匿名加工などデータ提供側の負担
・受け渡しが行えない場合は、実際にデータを保有する現場で分析(サイトビジット方式)を行うなど、物理的な制約が発生すること(コストや工数も発生してしまう)
・複数のデータソースを分析対象にする場合、データを一度集約させる方式が一般的。その際、データのクレンジング、DWHの運用(コストや工数)などが課題に。

このような課題に悩まされるデータ提供者や分析・研究者の方はおられるのではないでしょうか?

コンテナ技術を活用したデータ分析ソリューション

GDPRの対策として、オランダやドイツを中心にヨーロッパでサービスが開始されているPersonal Health Train (以下PHT)をベースにしたデータ分析ソリューションを企画・検証しています。

基本的な処理方法

①データ提供元(医療機関など)に実データを配置し、計算リソースを準備し、データ提供元の管理下とする。(Station)
②データ利用者(研究機関など)はDocker内にアルゴリズムとクエリを設定する。(Train)
③TrainをStationに送信し、各Stationを巡回し、アルゴリズムやクエリを実行する。
④処理結果(分析結果や学習モデル)を含むTrainがデータ利用者に戻る。

まとめると、、
分析者自身が作成したRやPythonで書かれたプログラムを、各データソースの分析用データベースに接続して実行、解析し、解析結果等の結果を得ることができる!ということになります。

メリット

・データを分析者に受け渡す必要がないため、データ抽出や受け渡しに係る工数の削減やデータ漏洩リスクの軽減に寄与できます
・大規模なデータセットを効率的に処理することが可能となります

実証実験を開始!

「Personal Health Train」と呼ばれる技術を活用し、データ提供者とデータ分析者間において、データを直接やり取りすることなく解析結果を得られる仕組みを確立します。この仕組みによって、大規模なデータセットを効率的に処理することで、臨床研究のアジリティ向上に寄与し、ひいてはリアルワールドデータの利活用加速化が期待できます。さらに、データ抽出や受け渡しに係る工数の削減やデータ漏洩リスクの軽減にも貢献できると考えています。

京大、国立がん研究センター東病院等とともに、医療機関同士のリアルワールドデータの安全・迅速な連携目指す研究を開始|プレスルーム|日鉄ソリューションズ (nipponsteel.com)

今後の活動

本ソリューションは、リアルワールドデータを取り扱う、医療機関や研究機関、ヘルスケア業界などで利用が進んでいくのではないだろうか?と検討しております。
また、個人情報の分析は金融機関やB2Cの事業会社など様々なフィールドで行われているため、本ソリューションが活躍するフィールドが他にもあるのではと考え、調査を進めていきます。

現在、想定しているユースケース

・複数の医療機関を結ぶ臨床研究
・連携、提携企業間でのリモート分析
・管理対象の下部組織のデータを統計的に集計

お問い合わせはこちら!

本ソリューションにご興味があれば、お気軽にお問い合わせください!