
データの組み合わせ方
私がDATA Saber Bridgeに参加している中で、特に苦戦した複数のデータを組み合わせる方法についてまとめてみました。
◦結合
共通するフィールドに一致する値でひも付けて、データを横につなぎ合わせる手法。
・内部結合:共通する値だけを含む
・左結合:左側の値は全て含み、右側は共通する値のみ含む
・右結合:右側の値は全て含み、左側は共通する値のみ含む
・完全外部結合:左右全ての値を含む
◦ブレンド
それぞれ集計結果をまとめて、同じビューに表示する手法。データの粒度が異なる場合も使用可。最初にドッロプしたデータを左にした、左結合。
◦リレーションシップ
(バージョン2022.2で追加)
複数のデータを組み合わせた分析。結合とブレンドの代わりに使用。必要なテーブルのみクエリするため、多くのデータを組み合わせることが可能。
◦ユニオン
複数のデータを縦につなぎ合わせる手法。
同じデータの持ち方をする複数のデータをまとめるときに使用。