「データモデリングとデザイン」データマネジメント知識体系(DMBOK)第5章の解説
はじめに
データモデリングとは何だろうか、システム開発したことのある人ならデータベースのテーブル設計をよく行うと思うのだけど、それがデータモデリングと呼ばれている行動。
ただ、DMBOKではこの章の目標は「文書化することである」と書かれておりテーブルそのものより文書化してそれがデータを使う人にとっての共通語彙になることが意義とされている。デザインはデータモデルを設計するという意味を込めてデザインとついているようだ。
気にしておくところと言えば、業務用システムのDB設計思想とデータ分析用システムのDB設計思想は違うので、そこのところを意識してモデリングをする必要がある。
DMBOKの各章の要約・解説
他の章も興味ある人はこちらからどうぞ。
今すぐわかるデータマネジメントの進め方
著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。
データマネジメント知識体系(DMBOK)第5章「データモデリングとデザイン」について
データモデリングとデザインとは
モデルとは既に存在するものを理解できるように表現したもの、また何かを作るときに使うひな形である。地図、組織図等もデータモデルの例とされている。
データモデルとは組織が把握した現状の姿、もしくはあるべき姿をしめしたもの。データモデルはデータ要件とデータ定義が表現されており、特定の記述方法で書かれる。
エンティティとリレーションシップ
エンティティとは
一般的にエンティティとは、ほかのものから分離されて自立している存在と定義されている。
データモデリングの世界でエンティティとは、ある組織が情報を収集する対象のこと。
リレーションシップとは
リレーションシップとはエンティティ間の関連性である。
概念エンティティ間の概念的相互作用、論理エンティティ間の詳細な相互作用、物理エンティティ間の制約が表現される。
エンティティとリレーションシップの図式表現
概念データモデル
概念データモデルとは、エンティティとエンティティ単位でリレーションシップを行ったもの。リレーションシップの書き方は何例かDMBOKで紹介されている。
実務的にはテーブル設計をするときに、エンティティ単位でどのような業務を扱うのかを分けて、リレーションを考えることでどのように設計していくかの全体感を作っている。
論理データモデル
論理データモデルは、エンティティと属性を一つの図式に表現したものをリレーションシップしたもの。属性とはエンティティを識別、記述評価するプロパティである。
実務的には概念データモデルに対して、どのようなデータが紐づいているかを書き起こして、扱いやすいテーブルになっているのかをER図を書きながら考えながら作っている。
物理データモデル
物理データモデルは詳細な技術的ソリューションを表すもの。論理データモデルを出発点とっして、ハードウェア、ソフトウェア、ネットワーク等の技術的環境に適応するように設計される。
実務的にはPKをどうしようかとか、型をどうしようかとかを命名をどうしようかとか考えて、実際にテーブルを作るための元となる資料、テーブル定義書を考えながら作っている。
「データモデリングとデザイン」のゴール
データモデリングとは、データ要件を洗い出し、分析し、取扱スコープを決めるプロセスであり、データモデルと呼ばれる様式が用いられ表現される。
企業の持つデータが様々な観点を理解し、確認し、文書化されている
アプリケーションの業務要件とデータの整合性が取れている
文書が整理され、マスターデータマネジメントを成功するための基礎ができている
「データモデリングとデザイン」の進め方
データモデリング計画
データモデリング計画では、以下の観点で計画をまとめる
データモデルをどのスキーム(リレーショナル、ディメンショナル、オブジェクト指向、ファクトベース、タイムベース、NoSQL)を使用するか
文書の作成でどの表記法(IE表記法、UML表記法、オブジェクトロール・モデリング)を用いるのか
データリネージをどうやって把握するのか
未解決な問題の棚卸と、未解決な問題を誰がどのように解決することができるのかという体制
データモデルの作成
データモデルは業務ニーズにこたえられるデータモデルでなければならない、まずは業務とのコミュニケーションを行い、認識を合わせる。
データモデルを作成するときは1から作成するのではなく、既存のデータ成果物を使用することで高速化が計れる。
作成の手順として概念データモデル、論理データモデル、物理データモデルの順で段階的に具体化したデータモデルを作成していく。
データモデルのレビュー
データモデルは品質管理が必要であり、継続的に改善が行われる必要がある。レビューは価値獲得に要する期間、サポートコストなどの品質に係る観点で継続的にレビューする。
データモデルの維持と更新管理
データモデルの正確性、完全性、一貫性を継続的に評価し、文書を更新し続ける必要がある。
論理データモデルと物理データモデルの整合性がとれている事を確認する。
「データモデリングとデザイン」の成果物
データモデリングはデータモデルを作成するプロセスなので、成果物はデータモデルとなる。
データモデルはメタデータを包含し構成されるため、メタデータの成果物と重複する部分がある。
データモデリング計画書
データモデルに係る既存文書リスト
概念データモデル
論理データモデル
物理データモデル
データモデリングとデザインの解説動画
AI事務員宮西さんでおなじみの宮西さんと松田さんの解説動画となります。
データモデリングとデザインについて解説しているので、動画で学びたい人は是非ご覧ください。
おわりに
自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。
データマネジメントを学ぶ人が抑えておきたい本
今すぐわかるデータマネジメントの進め方
著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。
データ組織立ち上げ編 AI事務員宮西さん
著者のデータ組織の立ち上げ経験をマンガ+コメントでまとめてみました。立ち上げ編は組織を立ち上げてやることが決まるまでのストーリーです。
無料公開のため0円となります。
データ組織の立ち上げに関係する方は是非読んでみてください。
DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。
実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。
個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。
データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。
データマネジメントが30分でわかる本
著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。