Tableau Tips特集(集計と非集計の考え方)
この記事は、分析ツールであるTableauで分かりにくい部分をピックアップしてご紹介することを目的としております。
今回はTableauの計算フィールドで関係する“非集計計算“と集計計算がテーマです。“非集計計算“と集計計算の考え方は少しややこしいですが、ご説明致します。これからTableauを活用してデータ分析をしたい!という方は是非読んでみて下さい。
▶非集計/集計の違い
Tableauでは以下の様に計算フィールドを活用するかと思います。
そこには、“非集計計算”と“集計計算”の考え方を理解する必要があります。
今回は利益率を使ってご説明致します。
・非集計計算(Non-Aggregated):
これはレコードごとの値そのものを指します。例えば、売買履歴レコードが10個ある場合、それぞれのレコードに存在する売上の値全てを指します。[売上]のように書かれた非集計の値は、全てのレコードの売上を指します。
・集計計算 (Aggregated):
これは複数のレコードの値を何らかの方法で1つにまとめることを指します。例えば、10個の売買履歴レコードがある場合、その売上の合計を計算して1つの値として出すことです。集計関数としては、SUM(合計)、AVG(平均)、MAX(最大値)などがあります。したがって、SUM([売上])のような集計の値は、全ての売上を合計した結果の1つの値を指します。
※集計計算は、必ずメジャーとして扱います。
集計結果となるので、文字列であってもディメンションとして扱うことは出来ません。
それでは、サンプルスーパーストアのデータを例に詳しくご説明します。
A.非集計計算
B.集計計算
A、B共に利益率を算出しようとしている計算に見えますが、
ただSUMや括弧が付いただけで何も変わらないのでは?と思う方もいるかと思いますが、実は大きな違いがあります。
Aの”非集計計算”は、レコードごとの値そのものであるので「行単位」を指しています。
つまり、1レコードごとの利益率を計算してから、合計の利益率を算出しています。具体的には、以下の①~②の順序で計算しています。
Bの“集計計算”は、複数のレコードの値を今回はSUM関数で1つにまとめることを指します。
つまり、先に売上と利益を集計してから、利益率を計算する形になります。
具体的には、以下の①~②の順序で計算しています。
※集計計算
非集計計算と集計計算の違いはお分かり頂けたでしょうか。
計算フィールドのエディタでエラーとなってしまった場合には、
是非この非集計計算、集計計算の観点も踏まえてチェック頂けると良いかもしれません。
今回はここまでとなります。いかがでしたでしょうか?
今後も活用のTipsをご紹介してまいりますので、次回お楽しみに♪
もっとDMPについて知りたいことがある場合には、以下に関連リンク集を貼っております。必要に応じて是非ご活用下さい!