見出し画像

【Tableau】結合/ブレンドの概念について個人的備忘

データの結合、ぼく個人としてはなんか戦隊モノの特撮でみんなで合体してデカくなるロボットみたいですきです。(?)

下記YouTubeでKT氏が解説しているデータの結合については、
TableauDataSaberで言うとOrd.3の【HandsOn - Intermediate I】で通っていく道だと思います。

皆さんはわかりましたか?僕はわかりませんでございます。(正直者)

ただ、動画の見返しと、下記記事も読み込んでずいぶんわかりやすくなってきているので、備忘として簡単にまとめます。


◇抑えるのは3つ

①結合(JOIN)
②クロスデータベース結合(JOIN)
③ブレンド(ブレンディング)


①結合(JOIN)

複数のデータテーブルをくっつけて一つのデータテーブルにまとめちゃおうぜが結合です。
先に結合しちまって大きなテーブルをつくってしまうイメージなので、
集計は「後」になります。
いったん先にお見合いしてからだんだんお互いを知っていって(集計して)結納しようぜという結婚の流れで覚えています。

このベン図でお馴染み、結合

ちなみに、なぜベン図なのか?それは左のデータベースと右のデータベース、どちらを主としてどちらを従とするか?みたいなノリで優先度を策定するから。
外部結合と内部結合の違いも「または」or「かつ」だし、ここは感覚的にわかるかなと思っているので説明は割愛

②クロスデータベース結合(JOIN)

クロスデータベース結合は、データソースがExcelと別のCSVファイルで分かれている~~なんて時に使用されます。
基本的な概念は結合と一緒だが、データベースを外に大きく跨ぐんだなというイメージを持っておけば大丈夫かなと思っております。

③ブレンド(ブレンディング)

ブレンドは「先に集計されている結果を持つ表どうし」をもとに、
横につなげてくっつけていくデータ結合方式です。

たしかに、ブレンドコーヒーも、元は産地が違う豆だけど、栽培され、収穫されて拠点に運ばれたことによって(集計)、
そこからいくつかの豆を良い感じの配分でまとめて、焙煎するからたしかに~とうことで覚えています。

特に、結合との違いとしては、
「異なる粒度でのデータ結合を行う場合」は
ブレンドで鎖をつくってパワフルにつなげていこうぜ~という観点らしいです。

ブレンドはこの鎖でお馴染み。ブレンドコーヒー飲みたい。


ブレンド時の結合方法について、
プライマリーデータソース(青いチェック)と、
セカンダリーデータソース(オレンジのチェック)に大別されます。

プライマリのほうが親分となっていて偉いので、
その他のブレンドデータは従の関係になります。
これはワークシート単位で決まるので、最初にディメンションに突っ込んだデータソースが親分になる点が注意。



実際に使うケースや使い方はDataSaberプログラムでも詳説されているので割愛しますが、
結合とブレンド、それぞれが集計してからくっつけるのか、くっつけてから集計するのか?

その概念を先に抑えておくことで、理解のしやすさが個人的には変わるので、うまく覚えて活用出来ればと思います。

いいなと思ったら応援しよう!