将来のスタンダードかも?dbtが優れている点5選
データエンジニアリング界隈でじわじわと輪を広げつつあるdbtですが、何が優れているのかを見てみましょう
1. バージョンコントロール
もはやなくてはならないバージョンコントロールですが、dbtはgitとネイティブに統合できてスムーズです。
他の類似サービスはほとんどバージョン管理ができないので頭一歩突き出ていますね。
2. シンプルで直感的
DRY原則をモットーに構築されているdbtだとものの数分以内に使い始めることができます。
Pythonなどの言語を新しく学ぶ必要すらありません。
3. 自動ドキュメント
ドキュメントって意識して整備していないとすぐ陳腐化していまうんですよね。
そうなるとユーザーは何を信じたらよいかわからなくなってしまいます。
その点メタデータを使って自動的にドキュメンテーションしてくれるdbtは信頼性を高めてドキュメンテーションコストを軽減してくれます
4. ベンダー互換性
Amazon Redshift、Azure Synapse Analytics、Microsoft Fabric、Google BigQueryといったパブリッククラウドのデータウェアハウス製品やMySQL、Postges、DuckDBといったオープンソース製品ともスムーズに接続することができます。
選択肢が広いって素晴らしいですね!
5. テスト
各パイプラインの実行前にいくつかの品質チェックを行ってくれますし、追加でSQLを書いてテストをすることもできます。
これも他のデータウェアハウス製品ではあまり見ない機能です。
ではdbtは最強なのか?
残念ながらそんな製品はないのです。
欠点のひとつはこれ一つで完結しないことです。
RedshiftであればRedshiftだけで保存も処理も提供もできまずが、dbtはそうではありません。
また学習曲線がちょっと急なことも挙げられます。
とはいえドキュメントは豊富なのでそこまで困ることはないでしょう。
参考
よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!