
Tableau 8つのハードルを越える㉒「ブレンディング(データブレンド) その3 ブレンディングの真価」

こんにちは。
前号、前々号でブレンディングとはどのようなものか、説明させて頂きました。
前号「ブレンディング その2」は下記になります。
今回は、そのブレンディングの真価が発揮される場面をご紹介したいと思います。(今回、紹介する利用方法は、データモデル「リレーションシップ」では実現できないものになります。
なお、リレーションシップについては下記記事もございます。
https://note.com/ritz_tableau/n/ne01ca58302b7 )
まず、私たちは、架空のハンバーガーチェーン「マスバーガー」の社員と仮定しましょう。私たちにはライバルのハンバーガーチェーン「モック」があります。

今、自社マスバーガーの全国の売上データと、ライバル会社モックの売上データを入手しました。このデータを用い、自社とライバル会社の力関係を分析したい、これが今から取り組む課題です。
(Tableau Publicに本記事で作成しているVizを載せています。)
https://public.tableau.com/app/profile/satoshi.ganeko/viz/____v2019_1/2
まずは、自社マスバーガーのデータの中身を見てみましょう。

このように、データには
・日付
・年代
・客層
・都道府県
・地域
・メニュー
そして売上が記録されています。
一方、モックのデータも見てみましょう。

このようなデータです。
・Date
・年代
・客層
・都道府県
・地域
・品目
そして売上です。
ほぼ、同じ項目のデータが記録されていますが、違う点がいくつかあります。
まず、
マスバーガーでの「日付」というフィールドは、モックでは「Date」です。
また、
マスバーガーでの「メニュー」フィールドは、モックでは「品目」となっていました。
以上、2か所のフィールド名の違いがありました。
あと、もう一つ違いがあります。
マスバーガーのメニューの中身に「バーガー」がありますが、
この「バーガー」に相当するものはモックでは「ハンバーガー」という違う名前で記録されています。
この辺も、記憶に留めておきながら、両データをTableauで視覚化していきましょう。
まず、自社マスバーガーのデータに接続しました。ディメンション、メジャーは下図になります。

つづいて、もう一つのデータ、ライバル社モックのデータにも接続します。
こちらのディメンション、メジャーは下図になります。

これで、前号と同様、データソースが複数ある状態となりました。
画面左上、データタブ(データペインと呼ばれる)で、それぞれのデータソース「マスバーガー」「モック」をクリックすると、下のディメンション・メジャーの部分も、マスバーガーとモックに切り替わります。(下図参照)
最初、ブレンディングを使い始めたころは、この切り替えがピンと来ず、いったい自分がどちらのデータソースの中身を見ているのか混乱しがちです。
もし混乱したら、左上のドラム缶アイコンのところで所望のデータソースを選択しているか、確認して下さい。

これで、データ準備が出来たので早速、売上の比較をしてみましょう
① まず、データソースをマスバーガーに切り替え
② メジャーの売上を列にドラッグ&ドロップ
続いて
③ データソースをモックに切り替え
④ メジャーの売上を列に持っていき、②で置いた「合計(売上)」の右隣にドラッグ&ドロップします。
この時、最初にマスバーガーの売上を利用しているのでマスバーガーがプライマリデータソース、次にモックのデータを利用しているのでモックがセカンダリデータソースとなります。
途中で、下記の様な警告メッセージが出るかもしれません。

これは、「今2つのデータソースを扱っているけど、双方に共通したデータの切り口(ブレンドリレーションシップ)がこのワークシートでは働いていないですよ。」という意味になります。
今回、もともとプライマリデータソース「マスバーガー」とセカンダリデータソース「モック」のデータを集計する共通のデータの切り口(粒度)は設定せず、データ全体で比較するつもりでしたので、このままで問題ありません。「OK」をクリックします。
これで、

このようなVizになりました。マウスを当てて数字を確認すると
左側のマスバーガーは4040022
右側のモックは、4228982
と出ました。(単位の事は気にしないください。)
両者、拮抗しています。
繰り返しになりますが、最初にマスバーガーのデータソースの売上を操作し列に持って行ったので、このマスバーガーのデータソースがプライマリデータソースです。そして、その後モックの売上を利用していますので、モックのデータソースがセカンダリデータソースとなりました。
このことは画面左上の、データペインで、マスバーガーに青色チェック、モックにオレンジチェックがついている事でも分かります。

一方

列の部分を見ると、最初にマスバーガーから持って行った合計(売上)には、何も印はついていませんが、モックから持っていた合計(売上)には、右側にドラム缶アイコンとオレンジのチェックがついています。これが、「セカンダリデータソースから持ってきている。」という意味になります。
整理すると、
列や行、マーク、フィルターに置かれているディメンション、メジャーのピル(青や緑の楕円の形)に何もチェックがないのは、プライマリデータソースのもの。オレンジのチェックマークがついているものは、セカンダリデータソースからきたもの。このように解釈して下さい。
さて、売上全体が拮抗しているので、今度は地域別に比較してみましょう。
データソースをマスバーガーに切り替え、ディメンション「地域」を行にもっていきます。

こうなりました。
ちょっと比較しづらいので、二重軸で重ね、背後にライバルのモック、手間に自社マスバーガーの棒グラフに変えてみます。Bar in Barと呼ばれるチャートです。

これで、関西、関東、加えて北海道で自社がリードしていますが、
九州でほぼ同じ、それ以外の地域では劣っている事が分かりました。
では、一番差がついている中部地方の中で、どの県で負けているのでしょうか?
これを知るには、中部地方をクリックし保持、次に、マスバーガーのデータソースから都道府県を行の地域の上に重ねて置き換えてみましょう。

すると、下図になります。

これで、中部地方の中で静岡県と福井県では自社が優位ですが、それ以外の件では苦戦しているのが分かります。
地域的な比較はできたので、次は客層別にみてみましょう。
フィルターの地域は一度、取り払って、
マックバーガーのデータソースから客層を、行の都道府県の上において置換しました。

こうなりました。
どうやら、サラリーマンに関しては強いようですが、他では負けています。
この分析視点も地域毎に見てみたいですね
では、地域を行に持っていき、客層の左に置きましょう。

すると、以下になります。

各地域、各客層別の比較が出来ました。
中部での「その他」での差が大きいですね。
という感じで、いくつかの視点で分析を進めましたが、
これを、もともとの2つのExcelファイルで実行するためにはどうするでしょうか?
まず全体の売上をSUM関数で合計し、比較します。
次に地域別に見るためには地域毎に集計しないといけません。ピボットテーブルを使える方は、両Excelシートにピボットテーブルを作って、結果の表を合わせてグラフを作って・・という作業でしょうか?
しかし、「じゃあ都道府県別では?」と言われたら、「すぐには出来ませんので次回持ってきます。」となるかもしれません。
客層別、さらに客層+地域別の比較のためには、また別の集計が必要です。
これらの作業、上記のTableau操作では数秒~1分未満で終わっています。
Tableauではマスバーガー、モック双方のデータに対し地域、都道府県、客層といった共通の切り口で臨機応変に集計が行われ、結果が合わさってVizが表示されています。
図で示すと下図のイメージです。

この切り口を瞬時に自由に変え、複数のデータソースから得られた結果を合わせてVizを作り出す。これが、Tableauのブレンディングの真価といえると思います。
*補足(データモデル「リレーションシップ」との関係。少し高度な内容です。)
また、今回、ご紹介した利用方法は、データモデル「リレーションシップ」では実現出来ません。
理由は、ブレンディングとリレーションシップの根本的な違いにあります。
・リレーションシップは、複数のデータテーブルを関連付ける時、あからじめ設定したキーすべてが結合キーとして働きます。
・一方、ブレンディングは複数のデータソースを関連付ける「共通の切り口(ブレンド関係)」のうち、実際にどれが働くかはワークシート毎に柔軟に変化します。
このような特徴のため、リレーションシップでは、自在に集計の切り口を変化させながら比較する事は出来なくなっています。
次回、さらに説明を続けていきたいと思います。
次号、「ブレンディング その4」は下記になります。
ご精読ありがとうございます。
*連載記事すべてへのリンクは、こちらのマガジンにまとめています。
By ritz_Tableau
2020-2023 Tableau Zen Master | 2019-2021,2023 Tableau Public Ambassador |2021 certified as Tableau Certified Professional | DATA Saber
X(Twitter) : @ritz_Tableau
Tableau Public : https://public.tableau.com/profile/satoshi.ganeko#!/
*記事の中に不正確な点などありましたら、是非、X(Twitter) Direct Messageでお知らせ下さい。よろしくお願いします。m(__)m

おことわり
当記事のコンテンツについて、商用利用でない場合は許可なく転載して頂いて構いません。(ハードル画像および他のサイトから引用している画像は除く)
転載の際は、当記事へのリンクを掲載し転載であることを明記してください。商用利用の場合は許可なく転載しないで下さい。
当記事のコンテンツについて、可能な限り正確な情報を掲載するよう努めていますが、誤情報が含まれたり、情報が古くなっている可能性があります。当記事に掲載された内容、および、当記事からリンクやバナーによって移動したサイトに掲載された内容によって生じた、損害等の一切の責任を負いかねますのでご了承ください。よろしくお願いします。