データマネジメント知識体系(DMBOK)第11章「データウェアハウジングとビジネスインテリジェンス」概説


全体像

BI ビジネスインテリジェンス

  • 組織の業務と改善の機会を把握する為に使われるデータ分析の一種

  • このようなデータ分析を可能にする一連の技術

  • BIは過去から現在の知見を提供し業務判断を支援

DW データウェアハウス

  • 意思決定支援データベースと、その関連ソフトウェアプログラムの組み合わせ

  • エンタープライズ・データウェアハウスは組織全体のBIニーズに対応するために設計されたセントラル・データウェアハウス

  • 企業全体の意思決定支援業務の一貫性を確保するために、EDWはエンタープライズ・データモデルに準拠している

  • エンタープライズ・データモデルは、実装独立の概念/論理データモデル

    • 個人業務視点ではなく、全社共通の視点で作成される

    • 主要データ・データ間のリレーションとそのルール、重要属性を持つ

DWH データウェアハウジング

抽出、クレンジング、変換、制御、取り込みプロセスなどの処理を意味し、取り込まれた後はデータウェアハウス内のデータを維持する

構成要素のDB

DWHとBIのデータマネジメント

DMBOK上のゴール

  • 業務遂行機能、規制遵守要件、ビジネスインテリジェンス関連アクティビティを支援するため、統合データの提供に必要な技術環境、ITプロセス、業務のプロセスを構築し維持する

  • ナレッジワーカの効率的な業務分析と意思決定を支援し実現する

「データマネジメント」と「DWHとBIのデータマネジメント」

データマネジメント

  • データの資産価値を維持・向上・提供

  • そのための計画・方針・手順を開発・実施・監督

DWHとBIのデータマネジメント

  • BIとDWを構築するための計画を立て、実行する

  • BIとDWをユーザが効果的な分析と意思決定ができる環境とプロセスを維持し、監視統制する

主要な作業と手順

要件を理解する

DW / BI プロジェクトの要件をまとめる

  • 業務上のゴールと戦略から始める

  • 適切な業務担当者を特定してインタビューする

  • 要件を一覧にして優先順位をつける

優先度の高い複数の業務に関わるデータを特定する

アーキテクチャの定義

データがどこから来てどこに行くか、どのタイミングで行くか、なぜ、どのようにウェアハウスに投入されるかを示す

  • 概念的なアーキテクチャが出発点

  • エンタープライズデータモデルを使ってアーキテクチャを維持

  • プロトタイピングによって、ITやアーキテクチャに対する高額なコミットメントを行う前

管理プロセスの定義

調整され統合された維持プロセスによって本番環境を管理し、業務コミュニティに定期的にリリースする。

ここではほとんど触れられていないが、運用プロセスの検討も重要となる

DWとDMの開発

  • データ開発: データを修復・変換・統合・保存し、利用できるようにする

  • ITの開発: データの保存と異動を担うバックエンドシステムとプロセス

  • BIツールの開発: 利用者が公開済みデータ成果物から有意義な洞察を得るために使うアプリケーション群

  • ソースからターゲットへのマッピング: 様々なシステムのデータエレメントを一貫性のあるマップにするために、DWには堅固なタクソノミ(論理データモデル)が必要

BIポートフォリオの導入

  • 適切なユーザコミュニティが適したツールを利用できるように事業部内や事業部間で調整

  • 共通の業務プロセス、パフォーマンス分析、管理スタイル、要件の整合性を確認して類似点を見つける

    • 高度な機能に焦点を当てデータの抽出に関するIT開発者

    • ほとんどの組織がすでにここのツールを購入している-->代替か共存か

    • システムリソース、サポート、トレーニング、アーキテクチャ統合のためのコスト。

  • 既存ツールや画面の資産を以下つため、BI要件を整理し共有する

    • What: 何を見たいか(画面/帳票のリスト)

    • Who: 誰が見たいか(画面/帳票ごとのユーザリスト)

    • Where/When: どこまで見たいか(データのスコープと粒度)

    • How: どうやってみたいか(ドリルダウンなどの機能)

その他の関連事項

メタデータ管理

メタデータリポジトリ

  • データ辞書/用語集

    • 業務用語でデータを記述

    • データを利用するうえで必要な情報(例えば、データ型、構造の詳細、セキュリティ制限)

    • 業務ユーザが担当領域のデータエレメントを提供し、定義し、定義の修正に責任を持つ

  • データのリネージ

    • システム変更やデータ問題がもたらす影響の分析

    • 発生源に基づいてデータの信頼性を判断する能力

  • データモデル

    • 多くの重要な業務プロセス、業務の関連性、業務用語は、データモデルの開発中に把握

    • この情報が破棄されないこと、および論理モデルと物理モデルが稼働後に更新され、同期していること

データカタログなどのツールを導入しても、論理名や値の意味などのビジネスメタデータは自動では集まらない。
業務ユーザも巻き込んだ、ビジネスメタデータの入力・更新の体制構築が必要になる。

プロトタイプとデータプロファイル

  • デモンストレーション・データセットを作成し、プロトタイプへの共同作業でディスカバリーステップを適用

  • データのプロファイリングはプロとタイぴイングに利用され、予期しないデータがもたらすリスクを軽減する

    • 低品質のデータがもともとソースシステムにあったり、データ入力機能からもたらされる

    • データはそのソース内では高品質であるかもしれない

    • ソースが異なればデータ全体としての統合プロセスがより複雑になる

ロードマップ

  • 構築は段階的

  • 望ましい最終状態を考慮する必要がある(それがウォーターフォールか、反復型か、アジャイルかは問わない)

  • DWバスマトリックスをコミュニケーションやマーケティングツールとして価値を高める


この記事が気に入ったらサポートをしてみませんか?