【医療データとAI】⑤ 外来で質問に「ある程度」答えられるように<2>「医療情報のモザイク化?」
再び私の役割
この【医療データとAI】シリーズは医療データやAIの最先端を追いかけることではありません。
そういったことはひとまず一部の最先端研究を行っている先生に日本や世界を引っ張って行ってもらいましょう。
私の役割は、次世代医療基盤法についての背景などの自分なりのイメージや理解を皆さんにお伝えして、先生方が外来で患者さんとコミュニケーションする際に役立ててもらおうということです。
なぜ私がその役割を?正直、全く詳しくないからです。
詳しい方にとっては当たり前過ぎで「どこが分からないかが分からない」状況なのです。
私にとっては正直「何も知らなかった」といっても良い状況ですので「分からないことが分かる伸びしろのある男」なのです。そういったことで良いモデルだと思います。
一問一答方式で
先日も一問一答方式で書きましたがその続きを書いていきます。
(患者さんからの質問頻度高そう<高>、質問頻度低そう<低>と頭に書いています。)
前回は次世代医療基盤法が個人情報保護法の特別法で、医療データの取得をしやすいようにするための法律だと最後に書かせていただきました。
特別法については「近年は、特別法の乱立や、特別法による一般法の骨抜き化が問題視されるようになり、特別法の制定には慎重な姿勢が求められるようになっています。」という圧力の中で制定されているので無闇に作られているわけではないと思います。
<低>「次世代医療基盤法に見直しはあるの?」
2018年5月、次世代医療基盤法が施行。同法附則*において施行後5年見直しが規定されていました。
(*附則第五条:政府は、この法律の施行後五年を経過した場合において、この法律の施行の状況について検討を加え、必要があると認めるときは、その結果に基づいて所要の措置を講ずるものとする。)
つまり状況に応じて「所要の措置を講ずる」、つまりわかりやすくすると「状況に応じて変えていく」ということです。
<高>「具体的に次世代医療基盤法にどんな見直しがあったの?」
2018年に施行されたとのことなので、2023年に何らかの変更がされているのでは?ということで調べてみました。
まず1つ目は正式名称に変更があったのです。
「医療分野の研究開発に資するための匿名加工医療情報に関する法律」が「医療分野の研究開発に資するための匿名加工医療情報及び仮名加工医療情報に関する法律」へと変更になりました。
つまり、次世代医療基盤法という略称ではわかりませんでしたが、正式名称では「仮名加工医療情報」が加わりました。
法律改正が「所要の措置」として「仮名加工医療情報」がを正式名称に加えたということはどういうことでしょうか?
様々なバランスの中で法律改正が行われるので、これだ!という一つに絞ることは出来ないですが、この5年間で「仮名加工医療情報」がないと目的が達成できなかったのかな?というイメージで理解してもらえると良いと思います。
<高>「どんな問題があった(と類推される)の?」
改正の次世代医療基盤法における医療情報には
・「匿名加工情報」:は特定の個人を識別できない状態に加工した情報
・「仮名加工情報」:他の情報と照らし合わせる事で特定の個人を特定できる情報
という2種類の情報が対象になったのです。
改正前の「匿名加工情報」の課題は
(*このPDFを参考にさせてもらいました)
・希少症例や特異値等は医学研究上有用なデータだが、匿名加工のためには削除しなければいけない場合があり、匿名加工医療情報の活用がしづらい
•患者個人の時系列変化を追いかけるための継続的なデータ提供が、匿名加工のため困難•カルテなど元となる医療情報に立ち返った検証ができない、カルテ内に含まれる他の医療情報を追加提供することが困難→薬事承認等に利用できない、追加研究が難しい
•ゲノムデータは個人識別符号に該当することから、匿名加工医療情報としての取扱いは困難
そういったことから「仮名加工情報」が必要という改正になったのです。
の記事の表現だと
「2022年8月現在で計約247万人分の情報を集めたが、提供実績は22件にとどまっている。」とNEGATIVEな印象だが
https://www.nomuraholdings.com/nhs-a/services/publication/data/healthcare_200.pdf
のPDFだと「2018年5月に法律が施行され、5年が経過した2023年5月末時点では、三つの認定作成事業者が国の認定を受けて事業を実施している。3事業者を合計すると110の医療機関・地方自治体等から約270万人分の医療情報を収集している。医療情報の提供に協力いただいている施設の多くは、国立病院機構等の公的病院であるが、中には診療所や地方自治体、大学等が協力機関となっている例もある (図表4)。
また、収集された医療情報は、匿名加工され、これまで22件が研究のために提供されている。新規プロジェクトを正式に開始する前に実現可能性を調査するために行われる、いわゆるフィージビリティスタディの用途が多いが、学術論文として公表された事例も存在しており、一定の成果を挙げつつある(図表5)。」とPOSITIVEな印象です
ミスリード?
ここで注意しなくてはならないのは270(247)万人分のデータから22件の研究ということです。
普通に注意せずに読むと、「270(247)万人のデータのうち22人」のデータと読んでしまいがちですが、「270(247)万人のデータから22件の研究」ということです。
一件あたりの研究ではかなりの人数のデータを使うはずなので 「人」と「件」を混同するとミスリードされるので注意したい。
しかし、改正をしたというのは国や業界はもっと研究の件数が多いものと予想していたのがそれ以下だったということが類推されます
<高>「仮名加工情報の読み方は?」
仮名とはひらがなやカタカナの「かな」?
モザイクやボイスチェンジャーなどを使ったインタビューなどで出てくるAさん(仮名・23歳)の「かめい?」
状況を考えてみましょう!
個人情報をできるだけ保護できるのは?「かな?」「かめい?」と考えると「かめい」ですね。
<高>「仮名加工情報がなぜ必要?」
仮名加工情報とは、個人情報を加工して、他の情報と照合しない限り特定の個人を識別することができないようにした情報のことです。
仮名加工情報の必要性は、以下の2つに分けられます。
1.個人情報の保護を図るため(ブレーキ)
個人情報は、本人の同意なしに第三者に提供したり、利用したりすると、個人の権利や利益を侵害する可能性があります。仮名加工情報に加工することで、特定の個人を識別することができなくなるため、個人情報の保護を図ることができます。
例えば、学校で成績や出席状況などの個人情報を管理しているとします。これらの情報をそのまま第三者に提供すると、個人の成績や出席状況が知られてしまい、不利益を被る可能性があります。しかし、仮名加工情報に加工することで、特定の個人を識別することができなくなるため、個人情報の保護を図った状況でデータの利活用ができるのです
2.データの利活用を促進するため(アクセル)
近年、データサイエンスや機械学習の技術が進歩し、データの利活用が注目されています。データの利活用とは、データから新たな価値を見出すことです。例えば、顧客の購買データから、新たな商品やサービスの開発につなげるといったことが考えられます。
しかし、個人情報をそのまま利用するとなると、個人の権利や利益を侵害する可能性があります。仮名加工情報に加工することで、特定の個人を識別することができなくなるため、データの利活用を促進することができます。
例えば、スーパーマーケットで買い物をした人の購買データがあるとします。これらの情報をそのまま利用するとなると、個人の買い物履歴が知られてしまい、プライバシーを侵害する可能性があります。しかし、仮名加工情報に加工することで、特定の個人を識別することができなくなるため、データの利活用を促進することができます。
このように、仮名加工情報は、個人情報の保護とデータの利活用のバランスをとるために必要な制度なので。
イメージとしてあっているかは不明ですが、私個人のイメージとしては以下のように説明しようかな?と(どんどん説明の仕方帰ると思いますが)
「仮名加工情報は、個人情報を『モザイク』をかけたような情報と考えるとわかりやすいかもしれません。モザイクをかけた写真からは、誰だかわからないでしょ。仮名加工情報も、個人情報を加工して、誰だかわからないようにしているんです。個人情報の保護のためには、個人を特定できないようにしておく必要があります。仮名加工情報に加工することで、個人を特定することができなくなるため、個人情報の保護を図ることができるんです。しかし、他の医療機関や未来と過去のデータの連結をするためには そこ人の認識が必要ですので氏名の代わりにIDなどを振ってその連結情報はデータの利活用者にはわからないようにするのが仮名加工情報なんです。」
このように、仮名加工情報は、個人情報の保護(ブレーキ)とデータの利活用(アクセル)のバランスを考えた制度と理解すると良いかもしれません。
このページにある以下の図から分かるように
匿名加工だと氏名が削除されてしまうと、A病院とB病院から甲野 太郎さんの関連付け(名寄せ)が取れないのです。しかし、個人名を削除してID(仮名)化することによって紐づけできるのです。
(以下の図はこちらを参考に)
今日はここまで
しばらくはこうやって一問一答で患者さんの質問に答えられるようなイメージを伝えていきたいと思います。
シリーズ【医療データとAI】について
先生方とともに自分も学習したいので新しいシリーズ【医療データとAI】を開始しました。私にとっても未知の分野で認識の誤りなどもあるかと思いますがお許しください。
そしてNYAUWのブログの目的は難しいことが理解できない自分自身が学習の過程で掴んだイメージを皆さんにもお伝えすることですので
・卑近すぎる例 失礼に見える表現
・プロから見るとそうでないこともある
などがあるかもしれません。
しかし、できるだけイメージをつかみやすいように、内容を難しくしすぎないようにを心がけていきます。受験勉強の語呂合わせのようにイメージやストーリーを伝わりやすくするためにという悪意の無い目的ですのでお許し下さい。
AIという誰も経験したことのない分野と医療のクロス分野では倫理や哲学もまだ統一されたものもないため議論が世界中で多方面にこれから行われることになると思います。
そういった中で私個人が考える長期的なマクロの医療という視点でこのブログを書いてまいりたいと思います。ミクロな意味・短期的な意味では「不適切だ」か「反対」と思われる方もおられると思います。
・これはあくまで個人としての見解のブログであること
・世間的な未来予想に則ったもので、他の方の考えを否定するものではありません。
その点をご理解下さい。
今後はこの分野【医療とAI】のプロフェッショナルな方々に教えていただきたいので「教えてやるよ!」、または、まだまだ知らないので「一緒に勉強したい」という方まで連絡お待ちしております。
NYAUWの活動リンク
LINKTREEで作っております