ビジネス職のためのデータ基盤入門:セマンティックレイヤーの紹介
データ基盤とは
データ基盤とは、全社でのデータ活用を推進するために、社内の各データソースからデータを抽出→加工→統合して完成するデータベースです。一般的には次のような構成になります。
今回は、ビジネスサイドのデータ活用という観点から、近年注目を集めているセマンティックレイヤーという概念を紹介します。
ビジネスサイドはデータベースの中身を理解できるのか?
さて、右側のBIツールの存在に着目してください。近年、BIツールを使用したデータ活用は多く行われていますが、これを行うのはビジネスサイドです。ここで問題が発生します。それは、ビジネスサイドがデータベースの中身を理解できるのか?という問題です。例えば、【売上】を集計したいというときに、どのテーブルのどのカラムを参照すればいいのか?計算方法はどのようにするのか?これらがわからないと、BIツールがあっても何もできません。このような課題を解決する概念がセマンティックレイヤーという概念です。
データベースとビジネスサイドの橋渡しをするためのセマンティックレイヤー
セマンティックレイヤーで行うことを簡単に表現すると、データベース内のシステム表現をビジネス表現に翻訳して、操作できるようにすることです。
例えば、先程の【売上】であれば、【売上】=カラムA+カラムBなどと定義をしてあげることです。ここでカラムA+カラムBのシステム表現を【売上】というビジネス表現に翻訳してあげることで、ビジネスサイドは【売上】を操作するだけで済みます。
では、次にセマンティックレイヤーの歴史を遡って見ていきます。
セマンティックレイヤーの歴史
セマンティックレイヤーは近年でてきた概念なのでしょうか?実はかなり前からある概念となります。この概念は、1991年にBusiness Objects(後にSAP社が買収)が特許を取得したときから存在します。BIツールにセマンティックレイヤーを構築する機能が備わっており、BIツールでセマンティックレイヤーを構築しながら分析を行っていました。その後は、あまり目立った動きはこの界隈にはありませんでした。しかし、近年のBIツールの隆盛に伴い、BIツールでのセマンティックレイヤー構築に問題が発生してきました。それは、BIツールごとのセマンティックレイヤーができてしまうという問題です。1種類のツールを使う場合であれば問題ないのですが、複数ツールを使う場合に、ツール間の指標定義に差異が生じてしまう問題が発生してきました。そこで、dbtはETL側(つまり、変換レイヤー)でセマンティックレイヤーを構築できるようにしました。また、LookerがLookMLを発表し、本格的なセマンティックレイヤーが普及し始めました。
なぜセマンティックレイヤーが近年重要視されているのか?
セマンティックレイヤーの検索トレンドを過去10年間(2013.11-2023.11)見てみると、ここ数年で伸びてきていることがわかります。
この理由としては、大きく3点考えられます。
1.セルフサーブ型BIツールの普及
BIツールの普及に伴い、企業内で複数のツールを使う状況が発生してきました。そうすると、例えば、【売上】という指標が各ツール内で定義され、その定義の差異により、わずかに異なった数値を出してしまう、等の問題が発生してきました。
2.SaaSツールの台頭
企業内で使用するSaaSツールの導入数は増え続けています。SaaSツールが増えるということは、分散したデータソースが増えるということです。そのため、データ統合はますます複雑になり、ビジネスサイドから統合データベースをそのまま理解することはもはや不可能に近くなってきました。
3.データの重要性向上
近年、AI技術の向上および普及により、データ資産が競争優位に直結するようになってきました。しかし、データがあったとしても、使用する側がデータの中身を正確に理解できないと活用はできません。そのため、使用する側に分かる形(および間違えないように)でデータを管理する必要性が高まりました。
以上より、セマンティックレイヤーを構築する重要性が高まっていると考えられます。
セマンティックレイヤーを構築するツールの代表例
セマンティックレイヤーを構築する代表的なツールとしては、dbt、LookML、cubeなどがあります。具体的な利用方法などは下記のドキュメントを参考にしてください。
dbt Semantic Layer | dbt Developer Hub
LookMLの紹介 | Looker | Google Cloud
Introduction | Cube Docs
まとめと次回予告
ここまで見てきたように、今後のデータ基盤においては、どのBIツールを使用したとしても、また、誰が分析するにしても、同じ指標に対しては同じ定義で分析できる仕組みが重要になります。そのためのソリューションの1つがセマンティックレイヤーの構築です。セマンティックレイヤーは、システム表現をビジネス表現に翻訳する層を設けることで、ビジネスサイドのデータ活用を促進します。この分野には引き続き、注目していきたいと思います。
弊社では、データ課題をオールインワンで解決するプロダクト「Morph」を開発しています。もしこの記事をみて、セマンティックレイヤー構築にご興味を持った方がいらっしゃれば、ぜひ弊社にご相談ください。
今回はセマンティックレイヤーをご紹介しました。実は、この近年のセマンティックレイヤーの重要性向上から重要な示唆が読み取れるのです。それは、SaaSツールでデータ管理をする限界が近づいているのではないか?という仮説です。次回はそれを掘り下げたいと思います。
興味を持っていただけた方は、Noteのフォローをお願いします。
次世代ソリューションMorphを活用して、あなたの現場のデータ活用を推進していきませんか?
無料プランも用意してあります。まずはサインアップして、そのパワーを体感してください
この記事が気に入ったらサポートをしてみませんか?