【Tableau】データ接続方法3種類と負荷
Tableauでのデータソースの接続方法3種類の違いやどこに負荷がかかりやすいかを解説します。
結合
結合したいデータが同一のDB内にあり、粒度が同じで結合可能な場合は結合での接続がよいです。(トランザクションデータとマスターデータの接続など)
結合でデータを接続した場合、行レベルの結合処理はDB側で行われて表示のための集計が行われた後に、TableauはVizに必要なデータのみが送られて表示のための処理を行います。そのため、結合でデータを接続しているときにパフォーマンスが悪い場合は以下の2点が考えられます。
結合する行データのレコード数が多く、DB側に負荷がかかっている
Vizで使うデータ量が多い
ブレンディング
ブレンディングは集計したデータ同士を結合するため、粒度の異なるデータや保管されているDBが違うデータ同士の結合を行うために使用されます。
集計は各DB側で行ったのち、Tableauは二つの集計データをリンクさせるために必要なフィールドとVizで使用するデータを受け取り表示のための処理を行います。そのため、結合でブレンディングでデータを接続しているときにパフォーマンスが悪い場合はリンクしている項目数が多くTableauが受け取るデータ量が多いため、Tableau側への負荷がかかっている可能性があります。
DB側で必要な粒度に集計されてレコード数が少なくなっている場合、Tableau側にも負荷が小さいです。
【クロスデータベース結合】
クロスデータベース結合は結合したいデータが同じ粒度ではあるが別のDBに存在している場合に使用されます。
行レベルデータの結合から集計、表示の処理まですべてTableau側で行うため、結合するデータ量が多いとローカルへの負荷が大きくなります。