DATA SABER(Tableau)への道しるべ~テスト対策&ビジュアライズのポイント①

最終試験に向けて、テスト対策兼ビジュアライズのポイントを記載。
最終試験前の直前確認メモ、かつ実務でTableauを使用しているときに見返してしまうような、要所を抑えたノートを目指す。

■シートを選択式のプルダウンで切り替え表示する(8ー1)

  • 「グラフ切り替え」のパラメーターを作成 ※データは整数、許容値はリスト)

  • 作成したパラメーターを計算フィールドとして作成(※計算フィールドにはそのままパラメーターを挿入するだけ)

  • 作成した計算フィールドを不連続に変換⇒フィルターに挿入⇒全ての値かつ「1」にチェック ※パラメーター作成時のリストに紐づく形

  • 上記の作業をシート分実施 ※現在の値とフィルターの数字(「1」は随時変更)

■日付データの中から最も新しいデータを抽出する(8ー2)

{MAX([オーダー日])}
  • {}の有無はシート上の条件に影響されるか否かを示す⇒{}がある場合、フィルター等の条件に影響されず、データセット全体のコンテキストで計算される

  • 最も古い日付を算出する関数は「MIN関数」

■顧客IDごとに最も新しい購入日を算出したい(8-2)

{FIXED [顧客 Id]:MAX([オーダー日])}

■特定の日付と日付の差分を算出したい(8-2)

DATEDIFF('day',[顧客ごとの最終購入日],[基準日])

■特定の数値(60日ごとや10,000円など)ごとにデータを分類したい(8-2)

・分類したいデータのテーブルの▼⇒作成⇒ビン

■顧客別のオーダー数をカウントしたい(8-3)

{FIXED[顧客 Id]:COUNTD([オーダー Id])}

■数値データの中から最大値を抽出したい(8-3)

WINDOW_MAX(COUNTD([顧客 Id]))=COUNTD([顧客 Id])
  • 上記の例は顧客ID(個別のカウント)における最大値を判定している

  • これを色に入れることで、最大値を含むデータの色付けが可能

1回のオーダーにおける金額を算出したい(8-3)

{INCLUDE [オーダー Id]:SUM([売上])}

💡 FIXEDとINCLUDEの違い
FIXED LOD計算

挙動: FIXED LOD計算は、ビューのレベルや他のディメンションフィルターに関係なく、指定されたディメンションに基づいてデータを集計します。
用途: 一定のディメンションレベルで集計された値を得るために使われます。この値は、ビュー内での表示や他のフィルターの影響を受けません。
: {FIXED [地域]: SUM([売上])}は、各地域ごとに売上の合計を計算します。この計算結果は、ビューにどのようなディメンションが表示されていても、また他のフィルターが適用されていても変わりません。

INCLUDE LOD計算
挙動: INCLUDE LOD計算は、ビューに表示されているディメンションよりも詳細なレベルのディメンションを計算に含めます。ただし、ビューのレベルに応じて最終的な集計値が変化します。
用途: ビューの集計レベルよりも詳細なディメンションでの部分集計を含めたい場合に使用されます。この計算は、ビューのコンテキストに依存します。
: {INCLUDE [顧客 Id]: SUM([売上])}は、ビューに表示されている他のディメンション(例えば、地域)内で、各顧客IDごとの売上を合計し、それらを更に地域レベルで集計します。

FIXEDとINCLUDEの主な違い★
集計の基準: FIXEDはビューのレベルや他のフィルターに影響されずに指定ディメンションでの固定の集計を行います。一方、INCLUDEはビューのレベルに応じて詳細なディメンションでの集計を行い、ビューのコンテキストに依存する結果を生成します。
フィルターの影響: FIXED LOD計算の結果は、ほとんどのフィルタータイプ(ディメンションフィルターなど)の影響を受けませんが、INCLUDE LOD計算の結果はビューのディメンションやフィルタリングによって変わることがあります。

■顧客ごとの2回目購入日を判定したい(8-6)

  • まずは2回目以降の購入日を判定する関数を作成

IIF([オーダー日]>[顧客ごとの初回購入日],[オーダー日],NULL)
  • 上記で作成した2回目以降の購入日の中から、顧客別で1番新しい日付を算出する関数を作成

{ FIXED [顧客 Id]:MIN([2回目以降の購入日])}

いいなと思ったら応援しよう!