データマネジメント知識体系(DMBOK)第13章「データ品質」概説

DMBOKをもとに作成しているが、DAMA日本支部の成果物が非常に参考となった


基本的な考え方

データ品質の位置づけ

  • データが高品質であることを保証する

  • これがデータマネジメントの根幹である

  • データ品質の良しあしは、すべてのデータマネジメント機能から影響を受ける

  • データ品質以外の機能は主にデータの器にフォーカスしている

  • データ品質は、データの中身に焦点を当てている。

データ品質を管理する意義

  • データ品質管理の目的はビジネスとしてそのデータから価値を引き出せるようにすること

  • 組織がデータを管理する目的はそれを利用するため

  • 高品質なデータ自体を目的としてはいけない。それは組織を成功に導く一つの手段に過ぎない

データ品質の改善効果

どのような価値をデータから引き出したいかっを明確にすることが重要

データ品質とは何か

  • データが果たすべき目的に合致しているかどうか

  • データ品質は目的とデータ利用者の要求によって決まる

  • つまり、利用者の目的とそのための品質要件を理解することがスタート

  • 要件は、新たな法令やサービスの企画などにより変化するため、継続的なキャッチアップが必要

ゴールと原則

ゴール

  • 利用者の要求にあったデータを継続的に提供できるようにする

  • そのための標準的な改善プロセスを確立する

原則

  • 重要性: 対象データを絞って実施

  • 根本原因の修復: データ品質活動からシステム改修やプロ背薄改善にもつなげる

  • 業務プロセスへの組み込み: 業務オーナーがデータ品質に責任を負う

本質的概念

データ品質評価軸とは「測定可能なデータの特徴または特性」と「測定可能なルールの基本」

出展: https://www.dama-japan.org/PublishedMaterials.html

データプロファイリング
業務ルールに沿った測定とは別に、実データの傾向を可視化することで、改善すべきデータと問題分析のインプットとできる

データ品質改善サイクル
一般的なデータ品質向上手法としてシュワート / デミングサイクル

  • 計画: データ品質チームが既知の問題に対して、その範囲・影響・優先度を評価し、解決に向けた基本計画を策定

  • 実行: データ品質チームが根本原因への対処をリードし、データの継続的な監視を計画

  • 評価: 要件に対して測定されたデータ品質を積極的にモニタ

  • 改善: 見つかったデータ品質の問題への対処

主要な作業と手順

アクティビティ

出展: https://www.dama-japan.org/PublishedMaterials.html

高品質なデータを定義する

現状の業務、データの理解、データ品質に関する問題点・気体の把握
この段階で最終的な優先順位を決めるのは難しいので、まずは品質に課題があり、改善効果が高い箇所にあたりをつける。

  • 業務ニーズを理解

  • 組織が抱えるデータ品質の現状を包括的に把握

  • データ品質改善の動機と優先順位に関して合意

  • データ品質の意義を定義し、プログラムの優先順位を提案

データ品質戦略を定義する

採用するフレームワークを定義し、進め方を決定する

  • 業務から求められる品質要件をどのように定義するか

  • 優先順位、品質管理の対象選定、業務ルールをどう定義するか

  • ステークホルダーとどのタイミングでどのようなやり取りをするか

  • モニタリング運用方法をどう定義するか

  • etc

優先されるデータと業務ルールを特定する

重要なデータを特定し、優先順位を付けたうえで、業務ルールを明らかにする

  • 優先順位付け

    • 規制要件

    • 財務上の価値

    • 顧客への直接的な影響

  • 品質評価軸に基づいて業務ルールを設定

    • 業務プロセスの入出力要件

    • 低品質なデータの識別方法

最初のデータ品質アセスメントを実施する

  • 目指すゴールは、データについて学び、改善のために実行可能な計画を策定すること

  • 後続アクティビティまで含め、まずは小規模にやってみて負荷や手順が機能するかを確かめる

実現可能な改善点を特定して優先順位をつける

検証した運用不可などを踏まえて、実行可能な範囲を検討する

  • 実施事項

    • 問題の特定: データプロファイリングの結果の整理など

    • 根本原因の特定: データ問題から影響を受けるステークホルダへのインタビュ

    • 優先順位付け: データ分析及びステークホルダとの協議

データ品質向上の目標を策定する

現状の品質・優先順位を踏まえて計画を立てる中で、取り組みの価値を説明できるよう業務価値・改善の目標を定義する

  • 計画

    • 長期視点(根本原因への対処)、短期視点(Quick Win)で策定

  • 取り組みの障害

    • システムの制約

    • データを利用しているプロジェクト

    • 変革に対する文化的な抵抗

  • 取り組みの価値の説明(対策)

    • 業務価値の定量化

    • 具体的で達成可能な目標の設定

データ品質オペレーションを開発し展開する

改善されたデータに対するデータ品質の運用を含めて計画

この記事が気に入ったらサポートをしてみませんか?