DATA Saber挑戦中 テクニック覚書③Ord5

今回はOrd5の復習をしながら、覚えきれていないテクニックを書いていきたいと思います。ほとんど覚えきれていないという事実(;'∀')


Ord5 HandsOn - Intermediate Ⅱ- 覚書

■文字列でもメジャーになり得る(Q1+α)

文字列などのディメンションでも、計算式に集計の計算関数が入っている場合は集計計算になるのでメジャーに分類される。

■パラメーターで選択して切り替える(Q2)

パラメータ データとは関連性のない外枠だけを決めた変数の箱。データに依存していないからこそ柔軟性を持っている。
パラメータを使用した計算式によって制御が可能。
例:パラメータ[売上または利益]で1が選択されたら[売上]、それ以外なら[利益]

パラメータとパラメータを使用した計算式

■ヒストグラムとビン(Q3)

ヒストグラム データの「ばらつき」を可視化するグラフ。データを区間ごとに区切り、各区間の個数や数値のばらつきを棒グラフに似た形の図で表現する。
ビン データを一定区間で区切った入れ物(ヒストグラムのX軸、度数分布表の階級)。
例:パラメータで選択した値ごとに区切った時のオーダー数のヒストグラム

5千から~2万(5千区切り)のパラメータ[ビンの切替]を作成
利益からビンのサイズに[ビンの切替]パラメータを設定したビンを作成する
選択したビンの値(1万)で利益を区切ったオーダ数のヒストグラム

■スモールマルチプル(パネルチャート)(Q4)

スモールマルチプル 一つの画面に複数のグラフ表現を盛り込み、一覧性を高めたもの。小さなグラフ(スモール)が複数(マルチプル)並ぶので「スモールマルチプル」と呼ばれる。
例:地域・カテゴリごとの数量・利益の散布図

地域・カテゴリごとの数量・利益の散布図のスモールマルチプル

■色を2つのディメンションにつける(Q4+α)

カードに移動させた複数のディメンションに対して色設定が可能。

色のディメンションが2つ

■クエリパイプライン(Q6)

クエリパイプライン Tableauがさまざまなアクションを実行する順序。
ディメンションフィルターが複数の場合、先に処理したいフィルターをコンテキストフィルターにすることで先にフィルターをかけることができる。
また、ディメンションはメジャーよりも早くフィルター処理される。

クエリパイプライン
2016年にカテゴリ単体で20万以上購入している顧客(カテゴリと年をコンテキストフィルター化)
メジャーはディメンションよりも後にフィルターがかかる

■地域ごとの売上トップ3サブカテゴリを出すには(Q7)

サブカテゴリのフィルター条件で上位3位と設定すると、全体の上位3位のサブカテゴリで絞られてしまう。
地域ごとの上位3位にするには、売上の表計算でランクにする。
あえて抜け(値がない隙間)を見えるようにするとわかりやすい。

隙間をあえて見せる

■フィルターしながら別画面へ移動するアクション(Q8)

フィルターアクションのターゲットシートを別のダッシュボードやシートに設定すると別画面へ移動できる。ソースシートもシートが設定可能。(基本的にはダッシュボードがよい)

ターゲットシートに別シートを設定

■移動平均(Q9)

表計算で移動計算の平均を選択すると移動平均が出せる。
月ごとに色分けしたい場合は、月を整数で返すDATEPART関数を使用し、集計を中央値にして不連続を選択する。

移動平均

■箱ひげ図(Q11)

箱ひげ図 データのばらつき具合を示すのに用いるグラフ。 データのばらつきはヒストグラムでもみることができるが、箱ひげ図は異なる複数のデータのばらつきを比較する事ができる。 また、箱ひげ図は四分位数を用いてデータの散らばりを表す。 四分位数とはデータを小さい順に並べて、4等分したもの。

箱ひげ図(参照:かっこデータサイエンスぶろぐ

■売上を10%、20%のように増加させる(Q12)

%を増加させるパラメータを作成する。

ステップサイズ0.1で10%ずつになる
カテゴリが選択パラメータと同じだったら、売上を増加パラメータで指定した分増加させる計算式

■同一画面上でWEB画面に遷移する(Q13)

ダッシュボードにWebページを配置する。
アクションの追加で「URLに移動」を作成し、URLターゲットでWebページオブジェクトを選択。

ダッシュボードにWebページを配置(例:Googleのトップページを設定)
アクションでURLに移動を作成

■予測インジケータ(Q14)

Tableauの予測機能。Tableau により自動的に最大 8 つのモデルから最適なモデルが選択され、その最適なモデルによって最も高品質の予測が生成される。
予測機能を使用するには
・1つの日付ディメンションと1つのメジャーが必要
・時系列にデータ ポイントが少なくとも5個必要
・季節性を推定するためには、少なくとも 2つの季節または1つの季節と5期間に十分なデータ ポイントが必要

アナリティクスの予測を使用する
予測インジケータを属性にすることで実績と予測をつなげることができる

■ページシェルフ(Q15)

ページシェルフ ページシェルフに配置されたディメンションの単位でビューを分割する機能。この部分に時間を表現しているデータを配置すると、時間をコントロールできるダイアログが表示され、ビジュアライズされているデータの時間を自由に操作することができる。

オーダ年をページシェルフに入れて年の遷移を表示させる


いいなと思ったら応援しよう!