見出し画像

匿名化されたデータから個人を特定

 英インペリアルカレッジ・ロンドンと、ベルギーのルーバン・カトリック大の研究チームは、匿名化されたビッグデータから高い確率で個人が特定されるという研究結果を、2019年7月下旬、英科学誌ネイチャー・コミュニケーションズに発表した(朝日新聞 2019年8月11日)。

 生年月日、性別、郵便番号の他、人種や市民権の状態、学歴などを組み合わせると、特定の度合いが高くなる。さらに、車の所有状況や住宅ローンの状態など、計15の属性情報を使うと、マサチューセッツ州の全住民の99・98%について、情報が特定の1人のものだと絞り込めた。

 これは、いま始めて生じた問題ではない。暫く前からあった問題だ。

 米国のネットビデオレンタル大手のNetflixの匿名化された貸出履歴のデータと、映画データベースサイト「Internet Movie Database」の書き込み情報を照らし合わせると、利用者の特定が可能になるとする論文がある。(WIRED「NetFlix Cancels Recommendation Contest After Privacy Lawsuit」

 アメリカのディスカウント百貨店チェーンTargetは、購買データの分析によって、女性が妊娠したことを本人より早く察知する。妊娠初期の女性はマグネシウム、カルシウム、亜鉛のサプリメントや、無香性の化粧水を購入する傾向があるからだ。おむつや幼児服のクーポンを、妊婦が買わなさそうなワイングラスや芝刈り機のクーポンと一緒に送ると、効果的であるという(New York Times「How Companies Learn Your Secrets 

 匿名の投稿が可能なTwitterで暴言を吐いたが、個人が特定され、謝罪した事件は数多くある。多くの場合、本人が特定されたのは、上記のようなプロファイリングによってではないが、似ている場合もある。
 投稿時間や行動範囲などの個人情報をツイートしている場合、これをFacebookアカウントの交友関係や位置情報、投稿時間や行動範囲などの個人情報と照らし合わせると、Twitterのアカウントは匿名でも実名が分かってしまう場合があるという。

 2017年に施行された改正個人情報保護法で「匿名加工情報」の制度が導入され、匿名化されていれば、個人情報を第三者に提供できることとなった。上のことは、この妥当性に疑問を投げかけるものだ。
 ただし、匿名の個人を特定する目的で、別に入手したデータと突き合わせることなどは禁じられている。例えば交通系ICカードの乗降履歴と、別会社のポイントカードの購買履歴などを突き合わせる行為は、「照合」と呼ばれて、禁じられている。

個人情報 プロファイリング 個人情報保護方 匿名加工情報 ビッグデータ IDFABC

いいなと思ったら応援しよう!