LOD計算を自分が一番分かる形でまとめてみた(INCLUDE)
こんにちは、momoです。
今回のテーマは「INCLUDE計算」です。
FIXED計算の終わりにちらりと触れた
「ビューの粒度(VizLOD)の影響を受ける」
というFIXED計算との違いを頭の片隅に置きながら
その使い方を具体例とともに確認します。
それではさっそく。
■利用シーン
サンプルスーパーストアの注文情報を探索しています。
一番気になる指標 [売上(合計)] を
[オーダー日(年)]ごとに見てみると
年々売上が伸びていることが分かりました。
でもこれだけでは、お客さん一人当たりの売上が
どのくらいで、どう推移しているのか分かりません。
ここで力を発揮するのが「INCLUDE計算」です。
■アウトプットイメージ
[顧客名別の売上合計)]の平均を
[オーダー日(年)]ごとに表示しています。
こうしてみると、全体売上合計だけでなく
顧客単価も年々伸びていることが分かります。
~ポイント~
・平均の対象となる売上合計は[顧客名]の粒度で計算していること
・平均は[オーダー日(年)]の粒度で計算していること
・ビューの粒度は[オーダー日(年])]であること
■やること①
まずは平均の対象となる
[顧客名] (VizLODと異なる粒度) ごとの
売上合計を求めます。
■やること②
①で求めた [顧客別の売上合計] を
[オーダー日(年)] (VizLOD) で集計(平均)した
棒グラフを作成します。
■完成!
[オーダー日(年)] ごとのビューに
顧客別売上合計の平均を表示することができました。
ちゃんとビューの粒度(VizLOD)である
[オーダー日(年)]も考慮してくれているようです。
■まとめ
INCLUDE計算を使うと
(ビューにある粒度) + (INCLUDEで指定したディメンション粒度)
で集計することができます。
ビューより細かい粒度で計算した結果が
ビューの粒度(VizLOD)で集計されるイメージ。
INCLUDEで指定したディメンションは
ビュー上は見えないものの
ビューから切り離されているわけではない
ということが確認できました。
次の回では、INCLUDE同様に
「ビューの粒度(VizLOD)の影響を受ける」
EXCLUDE計算を見ていきます。
おしまい。
<参考> がねこ師匠のお教え
特に、元データ・VizLOD計算・LOD計算の
レイヤーを分けた考え方を参考にさせて頂きました。
分かりやすく、丁寧なご説明をありがとうございます。