データマネジメント知識体系(DMBOK)第13章「データ品質」概説
DMBOKをもとに作成しているが、DAMA日本支部の成果物が非常に参考となった
基本的な考え方
データ品質の位置づけ
データが高品質であることを保証する
これがデータマネジメントの根幹である
データ品質の良しあしは、すべてのデータマネジメント機能から影響を受ける
データ品質以外の機能は主にデータの器にフォーカスしている
データ品質は、データの中身に焦点を当てている。
データ品質を管理する意義
データ品質管理の目的はビジネスとしてそのデータから価値を引き出せるようにすること
組織がデータを管理する目的はそれを利用するため
高品質なデータ自体を目的としてはいけない。それは組織を成功に導く一つの手段に過ぎない
データ品質の改善効果
どのような価値をデータから引き出したいかっを明確にすることが重要
データ品質とは何か
データが果たすべき目的に合致しているかどうか
データ品質は目的とデータ利用者の要求によって決まる
つまり、利用者の目的とそのための品質要件を理解することがスタート
要件は、新たな法令やサービスの企画などにより変化するため、継続的なキャッチアップが必要
ゴールと原則
ゴール
利用者の要求にあったデータを継続的に提供できるようにする
そのための標準的な改善プロセスを確立する
原則
重要性: 対象データを絞って実施
根本原因の修復: データ品質活動からシステム改修やプロ背薄改善にもつなげる
業務プロセスへの組み込み: 業務オーナーがデータ品質に責任を負う
本質的概念
データ品質評価軸とは「測定可能なデータの特徴または特性」と「測定可能なルールの基本」
データプロファイリング
業務ルールに沿った測定とは別に、実データの傾向を可視化することで、改善すべきデータと問題分析のインプットとできる
データ品質改善サイクル
一般的なデータ品質向上手法としてシュワート / デミングサイクル
計画: データ品質チームが既知の問題に対して、その範囲・影響・優先度を評価し、解決に向けた基本計画を策定
実行: データ品質チームが根本原因への対処をリードし、データの継続的な監視を計画
評価: 要件に対して測定されたデータ品質を積極的にモニタ
改善: 見つかったデータ品質の問題への対処
主要な作業と手順
アクティビティ
高品質なデータを定義する
現状の業務、データの理解、データ品質に関する問題点・気体の把握
この段階で最終的な優先順位を決めるのは難しいので、まずは品質に課題があり、改善効果が高い箇所にあたりをつける。
業務ニーズを理解
組織が抱えるデータ品質の現状を包括的に把握
データ品質改善の動機と優先順位に関して合意
データ品質の意義を定義し、プログラムの優先順位を提案
データ品質戦略を定義する
採用するフレームワークを定義し、進め方を決定する
業務から求められる品質要件をどのように定義するか
優先順位、品質管理の対象選定、業務ルールをどう定義するか
ステークホルダーとどのタイミングでどのようなやり取りをするか
モニタリング運用方法をどう定義するか
etc
優先されるデータと業務ルールを特定する
重要なデータを特定し、優先順位を付けたうえで、業務ルールを明らかにする
優先順位付け
規制要件
財務上の価値
顧客への直接的な影響
品質評価軸に基づいて業務ルールを設定
業務プロセスの入出力要件
低品質なデータの識別方法
最初のデータ品質アセスメントを実施する
目指すゴールは、データについて学び、改善のために実行可能な計画を策定すること
後続アクティビティまで含め、まずは小規模にやってみて負荷や手順が機能するかを確かめる
実現可能な改善点を特定して優先順位をつける
検証した運用不可などを踏まえて、実行可能な範囲を検討する
実施事項
問題の特定: データプロファイリングの結果の整理など
根本原因の特定: データ問題から影響を受けるステークホルダへのインタビュ
優先順位付け: データ分析及びステークホルダとの協議
データ品質向上の目標を策定する
現状の品質・優先順位を踏まえて計画を立てる中で、取り組みの価値を説明できるよう業務価値・改善の目標を定義する
計画
長期視点(根本原因への対処)、短期視点(Quick Win)で策定
取り組みの障害
システムの制約
データを利用しているプロジェクト
変革に対する文化的な抵抗
取り組みの価値の説明(対策)
業務価値の定量化
具体的で達成可能な目標の設定
データ品質オペレーションを開発し展開する
改善されたデータに対するデータ品質の運用を含めて計画
この記事が気に入ったらサポートをしてみませんか?