見出し画像

将来のスタンダードかも?dbtが優れている点5選

データエンジニアリング界隈でじわじわと輪を広げつつあるdbtですが、何が優れているのかを見てみましょう

「今日の技術」で何か分からないことやご意見・ご要望・ご感想があればどどっとお寄せください!
コメントはとても励みになりまし、筆者のさらなる深い理解や説明力へのフィードバックにもなります!
何よりあなたが分からないことは他の人も分からない可能性が高いので、コメントで補足できるようになります✨


1. バージョンコントロール

もはやなくてはならないバージョンコントロールですが、dbtはgitとネイティブに統合できてスムーズです。
他の類似サービスはほとんどバージョン管理ができないので頭一歩突き出ていますね。

2. シンプルで直感的

DRY原則をモットーに構築されているdbtだとものの数分以内に使い始めることができます。
Pythonなどの言語を新しく学ぶ必要すらありません。

3. 自動ドキュメント

ドキュメントって意識して整備していないとすぐ陳腐化していまうんですよね。
そうなるとユーザーは何を信じたらよいかわからなくなってしまいます。
その点メタデータを使って自動的にドキュメンテーションしてくれるdbtは信頼性を高めてドキュメンテーションコストを軽減してくれます

4. ベンダー互換性

Amazon Redshift、Azure Synapse Analytics、Microsoft Fabric、Google BigQueryといったパブリッククラウドのデータウェアハウス製品やMySQL、Postges、DuckDBといったオープンソース製品ともスムーズに接続することができます。
選択肢が広いって素晴らしいですね!

5. テスト

各パイプラインの実行前にいくつかの品質チェックを行ってくれますし、追加でSQLを書いてテストをすることもできます。
これも他のデータウェアハウス製品ではあまり見ない機能です。

ではdbtは最強なのか?

残念ながらそんな製品はないのです。
欠点のひとつはこれ一つで完結しないことです。
RedshiftであればRedshiftだけで保存も処理も提供もできまずが、dbtはそうではありません。
また学習曲線がちょっと急なことも挙げられます。
とはいえドキュメントは豊富なのでそこまで困ることはないでしょう。

参考

Why DBT is the future of data engineering?

よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!