Tableauの超基本 #3 : ディメンションとメジャー (+連続と不連続)
ここでは「ディメンション」と「メジャー」について整理します。Tableauに限らず、データを扱う際に必ず出てくる言葉ではないでしょうか。
また、Tableau を扱う際に理解しておきたい「連続」「不連続」もこれと関連するので、併せて説明してみます。
ディメンションとメジャー
ディメンションは切り口、メジャーは切られる値 と言えます。
が、ちょっとピンと来ないな、という方のために言い回しを変えると、
メジャーは、集計される値(行ごと→合計 のイメージ)
ディメンションは、集計結果を分ける単位
かな、と思っています。
切る、切られるの関係が成り立つのは、集計されているから
このように、「集計」の概念を踏まえて考えると良いと思います。
ディメンションで切り分ける、といっても、元データが1行しかない場合は切り分けられないですもんね。
連続と不連続 = 緑と青
では、次に、Tableauを使いこなすときに避けて通れない青と緑・・・
連続・不連続に移りましょう。
これ、説明が難しいんですよね。
自分も腹落ちするのに時間がかかりました。
なので、思い切って、定規とトランプだ!と言うことにしています。
なぜかというと、
連続(緑)を行・列に入れると、軸がはめ込まれ、目盛りが出てきます。
値は、目盛りの上で決まった場所にしか現れません。
一方、不連続(青)は、シンプルに切り口なので、目盛り上で位置が決まるものではないです。なので並べ替えができます。
ちなみに、フィールドをビューの行や列の位置にドラッグすると、
↓ こんなガイド表示がでてきます。自分にはこれが定規とトランプに見えました笑
色やサイズも同じ考え方なのですが、まずは行・列で考えるのが解りやすいと思います。
緑と青 ・・・値と切り口・・・メジャーとディメンション??
連続・不連続の概念、いかがでしょうか。いまモヤモヤしてても、使ってるうちに急に腹落ちするかもしれません。
さて、今、ちょっと意図的に、値と切り口という言葉を入れて説明してみました。
何が言いたいかというと、
メジャー = 連続(緑)
ディメンション = 不連続(青)では?
という疑問が出てきませんか?
集計された値って目盛りの上に乗るし、切り口は独立してるよね?(順序はあるかもだけど)
なので、イコールでいいんじゃない?と思いませんか?
個人的には、だいたいそれで良いと思います笑
メジャー ≒ 連続、ディメンション ≒ 不連続
初めてTableauを触る人には、いったん、メジャー = 連続(緑)で、ディメンション = 不連続(青)でいいよ、と言うことにしてます。
そうじゃないケースもあるんですが、説明難しいし、最低限使いこなせると思うので、一巡して慣れてきてから、理解すればいいんじゃないかなと思います。
【参考】なぜ 「≒」 なのか?
最後に、「≒」な理由を示してみたいと思います。
一気に理解しようと混乱する可能性があるので、ムズイな、と思ったら軽く流してください。
ケースは色々ありますが、個人的にわかりやすいと思う(笑)バスケの点数で考えてみます。
数値なので、目盛りに乗る、「連続データ(緑)」とします
この値を、メジャーとして考えると、合計は9点(集計)です
が、ディメンションとして考えると、
1点 x 2本
2点 x 2本
3点 x 1本
と5本のシュートの種類を「切り分ける」こともできます。
この時、必ずしも不連続(青)である必要はないので、
= ではなく ≒ となります。
まとめ
最後は多少強引でしたが(笑)いかがでしょうか。
もう一回おさらいすると:
メジャーは集計される値 、 ディメンションは集計結果を分ける単位(集計の概念と併せて考える)
連続・不連続 = 緑の定規と青いトランプ(目盛りとシャッフル)
厳密に言うと、「メジャー ≒ 連続、ディメンション ≒ 不連続」
始めはほぼ一緒と思ってよいと思う ※個人の感想
関連するトピック
超基本なのでほぼすべてに関連するのですが・・・
集計とは?(集計・非集計)
行と列
シンプルにといいつつ、またもやなかなかの長文。。。汗
最後まで読んでいただき、ありがとうございます!
これで青と緑のモヤモヤが少しでも晴れればうれしいです。