Tableau勉強復習ノート⑤クエリパイプライン
お疲れ様です。
本日はtableauの理解するべき概念の一つクエリパイプラインについて勉強したことを自分の言葉で書いていこうと思います。
以下のブログを参考にさせていただきました。
https://note.com/ritz_tableau/n/n3c2aeb89a346
クエリパイプラインとは
クエリパイプライン(オーダーオブオペレーション)
tableauが様々な計算やフィルターを実行していく順序。
基本的にtableauは「設定された粒度でデータを切り分けて集計計算」を行う。クエリパイプラインを理解していないと自分が意図した計算やフィルターを行っていないVizになってしまう。
tableauを手足のように扱うには、クエリパイプラインの理解が必須条件の一つ。
<クエリパイプラインの順序>
①抽出フィルター > ②データソースフィルター >
③コンテキストフィルター >④セット、コンディショナルフィルター(条件)、TOP N、FIXED LOD > ⑤ディメンションフィルター(全般、ワイルドカード) > ⑥INCLUDE/EXCLUDE LOD、ブレンディング、集計計算 > ⑦メジャーフィルター(計算結果でのフィルター) > ⑧予測、表計算の計算、クラスター、合計の計算 > ⑨表計算フィルター > ⑩傾向線、リファレンスライン
抽出フィルター
元データから抽出フィルター(拡張子 .hyper file)を作成する段階で利用しないデータを取り除き、必要なデータだけの抽出Fildeを作成する。
元データの件数自体が減るのでデータ量が軽くなる。
元データにライブ接続をしている時はこのフィルターは関係ない。
データソースフィルター
抽出フィルターと同じく元データの件数自体を減らすことができるフィルター。ライブ接続の場合、一番最初に働くフィルター。
★★抽出フィルターとデータソースフィルターはデータそのものにフィルターをかける。コンテキストフィルター以降は基本的に各ワークシート個別に対して働くフィルター
コンテキストフィルター
context(状況、環境)
ワークシートでデータを扱う上で前提となる「状況、環境」を決めるものと考える
セット
データをある条件で分ける。
設定した条件に当てはまるものがIN、当てはまらないものがOUT
IN/OUTともにViz上に表示する。
データどちらかを限定するのではなく、データを区分けして両方を表示する。
★★セットとグループの違いについて少し復習
セットは元データが更新されればセットも更新される(動的に変化するともいう)
グループは元データが更新されても作成時のまま。
コンディショナルフィルター
何かしらのディメンションをフィルターにドロップした時に表示される画面の「条件」タブで設定したフィルター
TOP N
何かしらのディメンションをフィルターにドロップした時に表示される画面の「上位」タブで設定したフィルター
セットは条件に当てはまるもの、当てはまらないものを分けて両方Viz上に表示する
フィルターは条件に当てはまるものだけをViz上に表示して、当てはまるものはViz上から除外する
TOP Nフィルター使用時によくあること
(1)TOP Nフィルター、(2)ディメンションフィルター を併用したい。
例えば家具カテゴリのみでのサブカテゴリ売上TOP3が出したいのにうまくいかない…
→TOP Nフィルターが優先されているから
(2)ディメンションフィルター をコンテキストフィルタにすると解決する
FIXED計算についてはここでは書かない。後ほど復習する。
ディメンションフィルター・メジャーフィルター
ディメンションフィルター
「カテゴリの家具のみ」「サブカテゴリの椅子のみ」などと、ディメンションを使ったフィルター。フィルターとしての機能はシンプル。
何かしらのディメンションをフィルターにドロップした時に表示される画面の「全般」「ワイルドカード」タブで設定したフィルター
メジャーフィルター
「とある平均値以上」「最小値より上のもののみ」など、メジャーを合計や平均など集計した結果を用いたフィルター
★★ディメンションフィルターのほうがメジャーフィルターより先に動く。
メジャーフィルターの「すべての値」とは何か
合計、平均、といった集計をせずに、レコードごとのメジャー(売上、利益など)の値をすべて個別で見ていくということ。
この設定にすると、メジャーを一つ一つ個別の値として持つということになる。
日付をフィルターとして使う時の設定について
<ディメンションとして扱われるフィルター>
相対日付、日付の範囲
年、四半期、月、日、週数、曜日、年/月、年/月/日、個別の日付
<メジャーとして扱われるフィルター>
カウント、カウント(個別)、最小値、最大値、属性
ブレンディング、INCLUDE/EXCLUDE計算についてはここでは書かない。後ほど復習する。
予測、表計算の計算、クラスター、合計の計算 よりメジャーフィルターが先に動く。
表計算とは何か
簡単に言うと、メジャーにひと手間を加えて値の見せ方を変えることができる機能のこと。
メジャーの下向き▼から「簡易表計算」で選べる主な項目
累計、差、差の割合、合計に対する割合、ランク、百分位、移動平均
年間累計、複合成長率、前年比成長率、年間累計の成長率
表計算フィルターとは何か
表計算の結果を利用したフィルターのこと
例えば売上ランクの1位~5位までにフィルターをかける際に使用するときなど。
NULL値の除外について
NULL値を除外する際にメニューから「データのフィルター」を選ぶとNULL以外の値を表示する設定にできる。
あの設定の時に使われているのが実は表計算フィルターである。