DAY8 DATA Saber Ord7【前編】
本日はOrd7について、各設問に沿いながら
私なりの感想や解釈、ポイントをご紹介させていただきます。
Ord7に取り組む上での参考動画はこちら。
それではやっていきましょう!
パフォーマンスが悪いとなぜいけないのか
我々がインターネットで検索するときと
同じイメージですね。
情報を求めているのに、
なかなか画面が切り替わらない・・・
そんな状態だと
・答えを得るのに時間がかかる
・フローに乗れない
・イライラする
・本当のTaskを忘れる
といった事象が発生します。
特に複雑であったり、
工程が分かれるような作業をしていると
Taskを忘れるというのはままありそうですね・・・
表計算はどこで処理されるか
Tableauで処理されます。
JOIN(結合)はどこで処理されるか
データベースで処理されます。
Tableau Desktopで表示が遅くてもTableau Serverで高速に表示できる
これは誤りです。
PCのスペックに依存しないTableau Serverを
利用すれば、高速に表示できそうに思えますが
Server側は我々以外の多くの処理も
受け付けています。
そのため、Serverを利用したから速くなる、
ということはまず無いようです。
Tableauのシートで作業する前に件数を減らせるフィルター
・抽出フィルター
・データソースフィルター
この2つになります。
データの集計が遅い場合、DBで事前にテーブルを準備してもよい
これは正しいです。
後工程で使いやすいように準備ができるなら
それも1つの手段だと思います。
売上のトランザクションデータと地域マネージャーのマスターデータのテーブルがある。これらのテーブルは同じスキーマ内に存在している。一般的に適切と思われる結合方法は
この設問、私は1度間違えました。。。
ポイントは「同じスキーマ内に存在している」
ということです。
なので難しく考えず結合でOKです。
売上のトランザクションデータと在庫のトランザクションデータのテーブルがある。これらのテーブルは別のデータベースに存在しており、異なる粒度でデータが格納されている。商品単位での売り上げと在庫とを比較したい場合、一般的に適切と思われる結合方法はどれか
この設問のポイントは
「テーブルが別のデータベースに存在」し、
「異なる粒度でデータが格納されている」
ということです。
そのため、ブレンディングを使用するのが
良さそうですね。
本日のまとめ
いかがでしたでしょうか。
Ord7 前半のポイント解説でした。
次回は後編です。
本日もご覧いただきありがとうございました!
またお会いできることを楽しみにしています。