見出し画像

【Tableau】データ接続方法3種類と負荷

Tableauでのデータソースの接続方法3種類の違いやどこに負荷がかかりやすいかを解説します。

結合

結合したいデータが同一のDB内にあり、粒度が同じで結合可能な場合は結合での接続がよいです。(トランザクションデータとマスターデータの接続など)

結合でデータを接続した場合、行レベルの結合処理はDB側で行われて表示のための集計が行われた後に、TableauはVizに必要なデータのみが送られて表示のための処理を行います。そのため、結合でデータを接続しているときにパフォーマンスが悪い場合は以下の2点が考えられます。

  • 結合する行データのレコード数が多く、DB側に負荷がかかっている

  • Vizで使うデータ量が多い

ブレンディング

ブレンディングは集計したデータ同士を結合するため、粒度の異なるデータや保管されているDBが違うデータ同士の結合を行うために使用されます。

集計は各DB側で行ったのち、Tableauは二つの集計データをリンクさせるために必要なフィールドとVizで使用するデータを受け取り表示のための処理を行います。そのため、結合でブレンディングでデータを接続しているときにパフォーマンスが悪い場合はリンクしている項目数が多くTableauが受け取るデータ量が多いため、Tableau側への負荷がかかっている可能性があります。

DB側で必要な粒度に集計されてレコード数が少なくなっている場合、Tableau側にも負荷が小さいです。

【クロスデータベース結合】

クロスデータベース結合は結合したいデータが同じ粒度ではあるが別のDBに存在している場合に使用されます。

行レベルデータの結合から集計、表示の処理まですべてTableau側で行うため、結合するデータ量が多いとローカルへの負荷が大きくなります。

いいなと思ったら応援しよう!