【Tabeau】Ordで使った機能まとめ
技術試験対策のための自分用メモとしてOrdで使った機能を箇条書きでまとめたものです
Ord1
ランク
順位(何番目?何位?)を問われている場合→ランクをラベルに表示させる
簡易表計算→ランク
既定の集計
割引率・利益率など表示方法・集計方法が決まっている(=平均/%)ものは
あらかじめデータペイン側で設定できる
既定のプロパティ→集計→平均
既定のプロパティ→数値形式→パーセンテージ
組み合わせのカウント
方法①組み合わせに使いたいディメンションを入れ左下のマーク数を見る
方法②計算フィールドで足す ※ディメンション同士は計算フィールドで足せる
Top10
Top10を選択して保持→固定セット
フィルターでTop10を選択して保持→動的セット
前年比成長率
簡易表計算→前年比成長率
線形の傾向線はアナリティクスペイン→傾向線→線形
年月ごとのデータをさらに別のディメンション(カテゴリごと)などに見たいときは年月を列に、区切りたいディメンションを行に入れると見やすい
文字列の分割
変換→カスタム分割から計算フィールドを使わなくても分割可能
生成された計算フィールドを見るとTRIMとSPLITを使っている
メジャーネームとメジャーバリュー
複数軸のvizを作るときに使う
三十軸の場合、より近い単位の項目2つをメジャーバリューに入れて(片方の項目をもう1つの項目の軸)残りの軸と二重軸にする
ラベル/軸の独立
ラベルは棒グラフの大きさを示すための一情報
桁数が大きすぎて圧迫される場合は書式設定→表示単位を調整する
1シート上でディメンションごとに軸の単位を分けたい場合
軸の編集→各行または列の独立した軸範囲を使う
累計・表計算をさらに集計する
簡易表計算で出した値をさらに集計したいときセカンダリ表計算を使う
→一部の表計算に限られるが累計などであれば可能
例:セカンダリ表計算で累計のカテゴリ差を出す
表計算の編集→次との差→特定のディメンション→カテゴリ
基準:前
関連性
関連性を示すには散布図
オーダー日(曜日)・カラーマップ
オーダー日を右クリック+ドラッグで曜日を選択
曜日単位の集計も可能
あるディメンションの相対的な比較値(月・曜日ごとの顧客数でどこが多いか)を視覚的に見るにはカラーマップも有効
カラーマップは
ディメンションを行・列に入れ計測したいメジャーを色にいれる→マークを□四角にするとできる
基準線(リファレンスライン)①
ラインの値を固定で設定したい場合はラインをクリック→値の設定で簡単に設定できる
相対的な比較・グループ
相対的な比較→カラーマップをつくる
グループ→Vizの中で任意の値を選択してグループを作成できる
基準線(リファレンスライン)②
Vizの中の特定のディメンションを選択すると、リファレンスラインが動く
元の設定ラインは薄く残るので最初に設定した基準値と比較ができる
ダッシュボードアクション
ダッシュボードに乗せた複数のVizの動きを連動させるフィルター的なもの
アクションの実行対象をメニューにすると、
クリックしたときに小さいテキストが出て選択ができるようになる
メニューのテキストはフィルターアクションの名前と一致するのでデフォルトでなく設定しておくのが良い
日数差/空間的な比較ー地図
日数差を求めるのはDATEDIFF
DATEDIFF(間隔,開始日,終了日)
間隔は'day''month''quarter'などと書く
空間的な比較(地域を位置で比較する必要がある)の場合は地図を使う
地図に使う場合は地理的役割の割り当てをしておく
必ず細かい単位からやる、日本地図の場合は都道府県の割り当て→地域の割り当ての順で、地域の割り当ては「次から作成」→都道府県を選ぶと都道府県に地域の情報が紐づく
クラスター/ハイライト
アナリティクスペインからモデル→クラスターを選んで散布図上でクラスターに分けることが可能
散布図のディメンション→ハイライターを表示
にするとハイライトすることができる
同じ画面でディメンションの傾向をざっくりとつかむのに便利
Ord3
結合/地図②/除外フィルター
同じデータソース内の別データ(Excelなら同ファイル内の別シートのデータ)をくっつけるときにデータソースタブで結合処理ができる
1つ地図を作成したあと、緯度をコピーすると地図を縦に並べることができる→別の粒度の地図を二重軸で重ねることも可能
アクションを設定した後、アクション先のシートでフィルターの編集→リストから選択、なし、除外を選ぶと選択したときに除外される設定ができる
ブレンド/プライマリグループ/分布比較
・ブレンド
別のデータソースを結合する場合にブレンドを使う
Publicではtdsxファイルを読み込みないのでzipに拡張子変換、中のデータファイルを新しいデータソース→接続→エクセルファイル→で接続するとブレンドの設定ができるようになる
ブレンドの設定はデータ→ブレンド関係の編集からカスタムで結合キーを設定できる
・プライマリグループの作成
紐付けたいグループを行に並べ、セカンダリソースの項目→プライマリグループの作成を選ぶと、セカンダリソースのディメンションをプライマリデータソースのディメンションとして扱える=プライマリデータソースだけで完結できる
プライマリグループをつくると、別のデータソースでもLOD計算が使えるようになるので便利
・分布比較
比較対象のディメンションを詳細に入れ(カテゴリ別のメーカー売上分布なら、メーカーを詳細に)、マークを円にすると比較対象のディメンションごとの分布をドットで表示できる
基準線(リファレンスライン)③、リファレンスバンド
ディメンションの各項目ごとにリファレンスラインを設定したいときは
「セルごと」でリファレンスラインを引く
基準を範囲で設定したいときはリファレンスバンドを使う(〇〇以下、以上など)
1行単位の集計/集計と非集計
集計したいメジャーをシートに表示した上で
メジャーをディメンションに変える
集計と非集計は並べて比較できるとよい
Top10/Worst10
上位下位を並べるにはセットと結合セットを使う
セット
フィルター→セットの作成
複数のセットを選択→結合セットの作成
黒字顧客と赤字顧客を並べる、といったことも利益額を条件式に設定すればできる
(フィルター→全般タブで「すべて」→条件タブで利益額を限定)
”不連続”のランク
簡易表計算でランクを不連続にするとあるメジャーの昇順・降順用ヘッダーとして利用できる
属性
シート上には項目として入っているが、LOD(集計単位)にはなっていない
シート状に入れたいがディメンションとして設定したくない場合に使う
レコード単位のフィルター
フィルター→すべての値で非集計の値をフィルターに設定できる
ディメンションごとの全体に占める割合(100%積み上げグラフ)
ディメンション別の積み上げ棒グラフでみせるとよい
全体に占める割合は、簡易表計算で
合計に対する割合の計算単位をセルにする
積み上げグラフのメモリの最大値はデフォルトが105%になっているので
軸の編集→範囲「固定」→終了値を1にすると100%積み上げグラフになる
三重軸
Tableauでは三重軸の機能はないので、3つのデータを1シートにするには、明らかに単位の違う2つを二重軸とし、単位が近いものは別の形で同じ軸に乗せる必要がある
同一シート内で小さなテーブルがあるエクセルファイルの読み込み(データインタープリター)
データソースタブでデータインタープリターにチェックを入れる→Tableauが整理したデータをユニオンで縦結合していく
横持ちデータを縦持ちデータに直す方法
データソースタブで横持になっている部分のデータを選択しピボット
日付の足し算(〇年分足すなど)
DATEADD('間隔',足す範囲分の整数(2年分なら2),対象の日付データ(足す前のデータ))
DATEADD('year',2,[オーダー日])ならオーダー日に2年足す
ブレンドされたデータと別名の編集
ブレンドされたデータ上で、同じデータなのに名称がそろっていない場合は
別名の編集で編集し名前を合わせればそろえることができる
Ord5
集計計算と行レベル計算
集計計算→計算フィールドの「集計」に入っている関数で計算した場合の結果が入っている場合はすべて集計計算
集計計算はあらかじめ週消された結果なのでメジャー→集計単位の変更はできない
行レベル計算は、行単位で集計したもの
利益率などを出すときは行レベル計算ではなく集計計算
パラメータ
変数が存在しないデータとは関連しない「箱」のようなもの
新しい単位で切り替え表示をするときなどによく使われる
計算フィールドと合わせて使う
ビン
金額などを区切る単位
頻度分布(ヒストグラム)を作るときに有効
メジャーを選んで作成→ビン
ビンのサイズを可変にする場合は、パラメータでビンのサイズを設定した上でビンの編集→ビンのサイズの参照元を作成済みのパラメータにする
WINDOW_MAX(最大値のみ強調)
最大値のみ強調して色を変えたい場合はwindow_max関数を使う
例えば、利益の最大値に色を塗りたい場合
WINDOW_MAX(SUM([利益])=SUM([利益])
コンテキストフィルター
優先的に欠けたいフィルターをフィルター→コンテキストに追加
メジャーフィルター
メジャーにかけるフィルターで、ディメンションフィルターよりあとにかかる
連続値のメジャーフィルターを使えば動的なフィルターを作ることができる
(Top〇の売上に絞るフィルターなど)
※参考_クエリパイプライン
https://x.com/TIkeda93820944/status/1790734180697190505
移動平均
表計算→移動計算→平均
現在の値を含める
URLアクション
Viz内にURLを埋め込んで同一画面内で見ることができる
予測モデル
アナリティクスペイン→予測
予測インジケータを属性に変更すると、実測値の値とつなげることができる
散布図の縦軸と横軸
原因が横軸、結果が縦軸になるように配置するのがベスト
時系列×散布図
方法1:時系列のディメンション(オーダー日など)を「ページ」へ
方法2:マークを線にしてパスやサイズにオーダー日を入れる
売り上げ増のシミュレーション計算
①増加の単位(カテゴリ別など)をパラメータでつくる
②売り上げ増加率を範囲パラメータでつくる
③①②を使って増加の単位=①のパラメータの時、売上に②の増加率を足す、そうでなければそのまま売上を出す
という計算式を書く
Best Performance
計算フィールド
整数>ブール>文字の順に早い
ロジック計算はIF分ではなくブール値を使う
[オーダー日]=TODAY()など
検索は、ワイルドカード照合>containts()>findの順ではやい
IF文の改善
分岐条件にANDを使っていて、ANDの前の条件が共通している場合は
先にAND前の条件を判定し、その後に分岐させる
→IF文の判定条件の中にIF文を入れ込む
IF A=1 THEN
IF B=1 THEN C
ELSE D
END
END
まずA=1かどうかを判定し、そのうえでB=1だったらC、そうでなかったらDという共通判定を先にして、後で分岐させている