「データ取扱倫理」データマネジメント知識体系(DMBOK)第2章の解説
はじめに
データ取扱倫理の章では、データを取り扱う上で配慮すべき点がまとめられている。
データ利活用ではデータをビジネスに役立てるとともに、データを正しく使うという点も必須で検討を行う必要がある。
具体的には直近だとLINEが中国にデータを保存していたことや、リクルートが就職の辞退率を分析して採用企業に連携していたこと、このようなデータを取り扱うためのルールについて書かれている章になる。
プライバシーを守るためにはルールの制定だけではなく、制定したルールを順守させる体制を構築する必要がある。
体制については第3章「データガバナンス」及び第16章「データマネジメント組織と役割期待」について詳細が記載されている。
DMBOKの各章の要約・解説
他の章も興味ある人はこちらからどうぞ。
著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。
データマネジメント知識体系(DMBOK)第2章「データ取扱倫理」について
データ取扱倫理とは
データを取り扱う上で考慮されていることが当然と期待されている事項である。
データの倫理原則として、まず3つの原則を抑えておく必要がある。
この原則をベースに各国がプライバシー法を定めており、データ倫理を成文化するために各国が異なるアプローチをとっている。
データプライバシー法とは、日本では個人情報保護法であり、ヨーロッパではGDPRである。これらの法律は上記の原則を明文化したものである。
人格の尊重
人々を個人として扱い、尊厳と自立性を尊重すること。
データの先には「人」がいる事を忘れてはいけない、例えばSNS等でAIが意図しない発信をしてしまってその人が発信したくないようなことを発信することは個人の尊厳を侵している。
データを使って利用するためには正しい同意が必要になる。
善行
害を与えてはならない、そして利益は大きくしなければならない。
全体最適化してしまうことで、個別にみると害を与えてしまうような事はあってはならない。データを使う運用者とサービス利用者とはWin-Winの関係を築かないといけない、データを提供することで損害を被る人がいてはならない
正義
人々に対する公正かつ公平な取り扱いをせねばらならない。
例えば、「アメリカで黒人の犯罪率は白人に比べて高い」ということが事実であったとしても、黒人全てを犯罪者として取り扱うことはしてはならない。女性、男性なども同様である。
事実を歪曲するためにデータを利用する
データは事実であるが、表現を飾り粉飾することで事実を歪曲してデータを使ってウソをつくこともできる。DMBOKでは歪曲する事例が書かれている。
また、意図的にうそをつくケースもあるが、データがどのように生成されるのかという、データリネージをしらないと、意図せず歪曲してしまうケースも出てきてしまうため、データを正しく取り扱い、データの管理をしなければならない。
虚偽的視覚化
誤解を招くような形でデータを表示する。このグラフは2015年より2016年のほうが減っているにもかかわらず見た目で着実に増えているように見せている。
不明確な定義または無効な比較
東京都のコロナの増減、今でこそ月曜発表は数が少ないからデイリーで追っていても無意味であることは認知されてきたが、定義がわからないものに対して増えた減ったをしても意味がないということ。
バイアス
バイアスの事例として一番わかりやすいのはサンプリングにバイアスがかかっているケース。
例えばインターネットで答えるアンケートで「Yahoo」を知ってますか?と聞くのはそもそも、インターネット利用者というバイアスがかかっているので、その回答を日本人の「Yahoo」認知度とするのは間違っているということ
倫理的なデータ文化の確立
倫理的なデータ取り扱いを行うための戦略を策定し、ロードマップを作らなければならない。
・現状評価
・順守すべき原則の整理
・リスク要因の確認
・ビジョンの作成
・ロードマップの策定
・実行体制の確立
「データ取扱倫理」のゴール
データ取扱倫理のゴールは組織がデータ倫理の原則と順守すべき法令を理解して、実行可能な組織としてのルールと体制を構築することがゴールとなる。
組織のルールは往々にして、制定された背景が見失われることが多いが、組織文化として定着させることも必須である。
組織としてデータの倫理的な取り扱いが定義されている
不適切なデータの取り扱いがもたらす組織のリスクについてスタッフが理解している
データの取り扱いに関する事項が文化として定着している
規制環境を注視し常に最新の情勢に対応できている
「データ取扱倫理」の進め方
データ取扱倫理のまず取り組むことは社会的な情勢を理解し、順守すべき事項を理解すること。守るべき事項が守られていなければリスクとして洗い出し、組織として改善の必要性を幹部役員と認識を合わせ、全社的な取り組みとしてルールの制定と教育を行う。
順守すべき原則と法令の調査
前半に書いたデータ取扱倫理の3つの原則、そして原則を基に各国が定めた法令、すなわち個人情報保護法、GDPR、AI倫理ガイドライン等の事項を調査して、ベースを調査する。
データ取扱業務の現状評価
企業内で行っているデータの取扱業務を洗い出し、調査した事項を遵守できているのか評価する。
リスク要因の確認
データ取扱業務の中でデータ取扱倫理の観点でリスクとなっている業務を確認する。リスクは完全に排除することはできないので、深さと頻度で検討するとよい。
データ取扱戦略の策定
洗い出した業務及びリスクをどうやって排除するのかという戦略を策定する。
具体的なルールの制定
法令、データ取扱倫理を遵守するために組織に適合したルールを制定する。ルールと同時に守るためのガバナンス体制も整える。
コミュニケーションと教育
ルールを守ることが目的とならないように、ステークホルダーへの継続的なコミュニケーションと教育を行い、データ取扱倫理を遵守することが目的であることを認識してもらう。
監視と維持
ガバナンスが機能しているのかという監視と、データ取扱倫理は情勢に応じて常に変化しているため、変化に合わせて維持し続けることが重要。
「データ取扱倫理」の成果物
データ取扱倫理の成果物は以下の通り。
成果物について取り上げるところは、データに関する企業倫理宣言とあり、企業はルール及び体制を整備し、対外的にプライバシーに順守していることを宣言することで安心・安全をアピールできる。
現行業務とギャップ
倫理的データ取扱戦略
コミュニケーション計画
倫理訓練プログラム
データに関する企業倫理宣言
データの倫理的問題に対する認識
整合性があるインセンティブ、KPI、ターゲット
ポリシーの更新
倫理的データ取扱報告
冒頭取り上げたLINEとリクルートでも以下のように、データに関する企業倫理に関することをユーザー向けにまとめたプライバシーセンターというものを公開している。
データ取扱倫理の解説動画
AI事務員宮西さんでおなじみの宮西さんと松田さんの解説動画となります。
データ取扱倫理について解説しているので、動画で学びたい人は是非ご覧ください。
おわりに
自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。
データマネジメントを学ぶ人が抑えておきたい本
今すぐわかるデータマネジメントの進め方
著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。
データ組織立ち上げ編 AI事務員宮西さん
著者のデータ組織の立ち上げ経験をマンガ+コメントでまとめてみました。立ち上げ編は組織を立ち上げてやることが決まるまでのストーリーです。
無料公開のため0円となります。
データ組織の立ち上げに関係する方は是非読んでみてください。
DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。
実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。
個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。
データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。
データマネジメントが30分でわかる本
著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。