【Tableau】メジャー・ディメンション、連続・不連続の関係
こんにちは。
Tableauを使えるようになりたいということで、DATA Saberに挑戦中です。
Tableauがそもそも初心者なので、躓くこともやはり多く。。。その中での学びをログとしてまとめていきます。
Tableauの学び始めには、「メジャー・ディメンション」と「連続・不連続」という概念に直面し、おそらく多くの方がその概念に躓くことと思われます。
もれなく僕もこの概念で軽い混乱が生じてしまったため、この記事で、これらの違いや関係を整理したいと思います。
ディメンション・メジャーと連続・不連続の関係に関する混乱
できる表現・できない表現の違いによる混乱
今回は、この2つの混乱のうち「ディメンション・メジャーと連続・不連続の関係」を整理してみます。
1. メジャー・ディメンションの基礎
まずは基本概念の整理から。
Tableauには、データを操作・表示するための二つの主要な要素があります。
ディメンション
ディメンションは、単純に言えば「カテゴリデータ」です。
たとえば、都市名や製品カテゴリ、日付や曜日など、データを分割または区別するための属性が該当します。
もう少し簡単に言うと「データを◯◯ごとに切り分ける」ためのものだというイメージです。(どこかのブログ記事にこの文言があり、僕はこの言葉で割りとイメージが付きました)
Tableauの画面で言うと↓の部分です。
メジャー
メジャーは「量的データ」と言えます。
このデータは、具体的な数値や計算結果を示します。
たとえば、合計、平均、最大値など、何らかの計算を行うことができる"数値"がこれに該当します。
ディメンションによって「◯◯ごと」に区切られたカテゴリの、それぞれの値を表示するものです。
見た目としては、棒グラフの高さや、ラインチャートの上下の変動などで表示されます。
2. 連続・不連続の概念
次に「連続」と「不連続」の概念について見ていきます。
連続 (Continuous)
連続データとは、その名の通り連続的なデータを指します。
例えば、気温や重量、売上高などの数値がこれに当たります。これらのデータは、スライダーや数値軸で表現するのが一般的です。
連続データは、小数点以下の細かい数値も含めて無限の範囲を持ち得る特性があります。(無限性・どこでも分割できるイメージ)
不連続 (Discrete)
不連続データは、個別の、独立した値やカテゴリを持つデータを指します。
たとえば、都市名や製品カテゴリ、具体的な日付などが該当します。これらのデータは、各カテゴリごとに分割して表示されることが多いです。
色で分かる?分からない?ディメンション・メジャーと連続・不連続の関係
誰から習ったのか、どこかで学んだのか、今となってはあまり覚えていませんが…
「ディメンションは青でメジャーは緑」
これが僕の当初の理解でした。
・・・が、これが混乱の始まりでした。
操作していると、「あれ、なんでディメンションなのに、緑になるんだ?」と気づく瞬間がくるんです。
たとえば、日付。
本来ディメンションの領域にあるのに、なぜかアイコンが緑(≒メジャー?)に変わる場合がありました。
逆もまた然りで、メジャーのはずなのに、青に変化するものもありました。
で、結論、
メジャー = 緑
ディメンション = 青
という理解は間違っていました。
正確には、
連続 = 緑
不連続 = 青
でした。
・不連続のディメンション
・連続のディメンション
・不連続のメジャー
・連続のメジャー
すべての組み合わせが存在し得るとのことです。
まとめ
Tableauの初学者(僕だけかもしれないが。。)が直面する認識として「ディメンション=青、メジャー=緑」という色の区別は明確で直感的に見えます。
実際、Tableauのインターフェイス自体もこのような区別を推奨しているため、初学者がこの色の違いを絶対的な基準として捉えるのは自然なことのように思われます。
しかし、実際の操作や実務の経験を重ねるにつれ、(例も挙げたように)色の区別が一貫していない場面に直面することがあります。
この一貫性のなさは、ディメンションやメジャーの連続性や不連続性の性質を無視して色を解釈するために生じるものです。しかし、連続・不連続の概念を理解することで、適切な色の解釈が可能となり、Tableauの操作もスムーズに行えるようになります。さらに、データの解析の質も格段に向上します。
そのため、色の違いを使ってディメンションとメジャーを区別するのではなく、連続性・不連続性という基本的な概念を理解することが重要です。