匿名加工情報で安心!パーソナルデータの活用
「デジテック for YAMAGUCHI」運営事務局 兼 「Y-BASE」スタッフのハラマルです。「デジテック for YAMAGUCHI」の会員で、お付き合いのある株式会社スオウ様が、レノファ山口のオフィシャルパートナー締結されたというニュースを目にしました。スオウの原田代表取締役が、「未だかつてない気持ちいいお金の使い方をしました!」というコメントをされていて、とても印象的です。私も、これまで以上に応援を頑張ろうと思います!
さて、今回は、Y-BASEで先日実施した「匿名加工情報」に関するセミナーを御紹介します。これは、個人情報を含むデータを取り扱っている方や、データ分析に興味はあるが個人情報・秘密情報の取扱いに不安・抵抗があるといった方に、是非読んでただきたいです。講師は、NTTテクノクロス株式会社の小林様です。セミナーを見逃された方は、Y-BASEのYouTubeチャンネルを見ていただくか、この記事の最後にもリンクを貼っておこうと思います。(動画の準備ができるまで時間差がありますのでご了承ください。)
「匿名加工情報」あるいは「仮名加工情報」という言葉は御存知でしょうか?その定義は、…と、ここで記載しても、私自身もよく理解できていないので上手に説明できません(笑)。後ほど、事例を交えてご説明しますので、一旦は置いておいてください。
来店・購買履歴などのお客様情報や、通院・処方履歴などの患者情報、学習履歴・成績などの学生情報といったものは、思いっきり個人情報です。こうした情報を分析すると、いろいろなことが分かりそうだなぁと思う一方、個人情報なので外部に出して分析することもできないし、他の事業者から情報をもらって分析することもできないなぁというのは、皆さん、感覚的には持っていらっしゃるのではないでしょうか?
実際、そのとおりで、個人情報保護法により、個人情報は、取得時にその利用目的を本人に通知又は公表する必要があり、本人の同意を得ていない目的外利用(別の用途での分析)や、第三者に提供することは禁じられています。例えば、セミナーに氏名・メールアドレス等を入力して申し込む際、「御提供いただいた個人情報は、本イベントに関するご案内・ご連絡のために利用します」と記載があった場合、この目的以外に個人情報(氏名やメールアドレス等)が使われることは禁止されています。なので、セミナー開催者が、「しまった、応募してくれた方を分析して、違う企画を検討したい」と思ったら、再度、「○○のために利用する」ということの同意を新たに得なければなりません。同意を取り直すという作業、少し非現実的というか、難しそうですね。
個人情報の取得時に、今後想定される全ての利用シーンを踏まえて同意を得ればいいのかもしれませんが、個人情報を取得する側としてもそんな想定ができませんし、個人情報を取得される側も、今後、何に使われるか分からないのに同意をしないといけない、というのは双方にとって大きな負担です。購買履歴データをマーケティング戦略立案に使う、移動履歴データを出店計画立案に使う、というデータ活用が進む中、個人情報を保護しつつ、データの利活用がしやすい社会を目指し、個人情報保護法が改正されています。
例えば、個人情報だったとしても、どこの誰だか特定できなくすればどうでしょうか?・・・少し考えてみましたが、元データは私の購買履歴だったとしても、この私、というのが特定されないのであれば、そのデータの中身が公開されても自分に不利益は生じないのかな?と思います。「この中年のおっさん、やたらとお菓子を買っているな」と思われたとしても(笑)、いや、私の事じゃないですと涼しい顔して過ごせます。その状態であれば、別にそのデータが、勝手に分析されたり、他の事業者が分析してもいいかなと。逆に、中年のおっさんが好むお菓子が研究されて、もっといい商品ができるかもしれません。そういう風に有効にデータ活用されるのであれば歓迎です。これが、「匿名加工情報」です。つまり、元データである個人情報を加工して、どこの誰のことか分からなくしてしまえば、元データの提供者本人の同意を得ずに、他の目的での利用や第三者への提供が可能になります。
ただし、匿名加工することによって、データの有用性が大きく失われることがあります。第三者には提供しないので、取得時には同意を得ていなかった他の目的で分析したい、又は同一企業内の他の部署にもデータ提供して分析したいといった要望があるかと思います。例えば、私の同意を得て取得した購買履歴を、同一企業内の健康食品部門が分析するという場合でしょうか。私とすれば、購買履歴を健康食品開発に使うことは同意していませんが、私という個人が特定されないのであれば、もうその企業は私の購買履歴データを保有しているので、有効に使ってもらってもいいかなと思います。これが「仮名加工情報」です。この際も、他の情報と照合しない限り個人が認識できないように加工する必要がありますし、データの利用時には、その情報を照合して個人を特定することは禁止されていますので、どこの誰だという個人は特定されません。というか、特定されたら困ります!
このように、匿名加工情報・仮名加工情報は、個人情報を保護しつつデータが活用できるように設計された制度です。
ところで、個人が特定されないように加工するって、具体的にどうするんでしょうか?私は、氏名・メールアドレスなどの列を削除するようなことをイメージしていましたが、そんな単純なことではありませんでした!浅はかだった自分を反省です。
例えば住所です。個人の住所は個人情報に該当しますが、かといって住所データを全削除してしまった場合、地域的な分析はできなくなってしまいます。そこで考え得る方法は、住所を、都道府県名まで、又は市区町村名までに留めるという加工です。そうすると、個人の特定までできなくなるかな、と思いますが、安心するのはまだ早いです。年齢や性別、傷病名などが一緒に入っているデータであった場合、「○○に住んでいて、この年齢・性別・傷病名だと、私しかおらんやん!」みたいなことになりかねません。
特徴があるデータも要注意です。体重が○kgとか、月間のお菓子購入代が○円とか、年齢が○百歳とか、データ自体の特徴が大きかった場合、氏名の情報がなくても、個人が特定されてしまうかもしれません。この場合は、例えば数値を○kg~○kgと分類したり、○円以上と変換したり、特異値を削除したりといった加工が考えられます。
このように、データを加工するには、法律に準拠して個人が特定されないようにするという「匿名性」の観点と、利用目的に応じてデータの特徴を維持するという「有用性」の観点から、具体的な加工方法の検討が必要になります。何にどのように使うかによって、例えばさっきの住所を都道府県名までに留めるのか、市区町村名まで必要になるのかが変わってきます。が、加工してみたら、「あれ、特徴がなくなって、分析したけど何も発見できない」ということにもなります。このため、匿名性と有用性のバランスを見ながら、どの項目をどう加工するといいのか、繰り返し作業が必要になります。
大変そうですね。でも安心してください。この作業をサポートするツールとして、Y-BASEのICT環境「Y-Cloud」に導入している「tasokarena(タソカレナ)」をご紹介します。このツールにはたくさんの加工方法が備わっており、また、AIが適用を検討すべき加工ルールを提案してくれます。元データである個人情報を加工してみて、どのように加工されたのかを見ることができますし、元データの有用性を評価することもできます。これを繰り返して、最適な状態に加工することができるツールです。
というのが、セミナーの概要だったと認識しています!意図的に詳細部分の説明を省いていますので、興味を持たれた方は、セミナー動画を視聴ください。
やまぐちDX推進拠点「Y-BASE」にご相談いただければ、無料で「tasokarena」を使ってみることができますし、その後のデータ分析まで技術的にサポートすることもできます。データ利活用に挑戦してみたいという方のご相談をお待ちしております。
※3月14日追記:当日の動画をアップしました