見出し画像

【第15話】Databricks_ノートブックのバージョン管理制限

みなさん、Databricks Certified Data Engineer Associate試験にチャレンジしている方に向けて、架空のキャラクターの会話形式で、試験の対策に役立つポイントをお伝えします。トピックごとに楽しみながら学べることを目指しました。それでは第15回、ノートブックのバージョン管理制限についての会話をお楽しみください。

のびデータ: 「みんな、ノートブックでバージョン管理ができるって聞いたんだけど、管理にはいろいろ制限があるみたいだね。詳しく教えてほしいな!」

ジョブアン: 「おれのデータはおれのもの、お前のデータもおれのもの・・・! Databricksでは、ノートブックの変更履歴はデフォルト設定で30日間だけ保持されるんだ。過去30日分の履歴が見られるということだぜ。」

のびデータ: 「え、30日しか保持されないの? ちょっと短い気がするな。もっと長期間、変更履歴を残したい場合はどうしたらいいんだろう。」

スキーマオ: 「ぼくが教えてやろう。ワークスペースの設定で、履歴の保持期間を最大1年まで延長することができるんだよ。ただし、保持期間を延長すると料金が発生するので注意が必要だぞ。」

のびデータ: 「1年まで設定できるのか。それは長期間の変更履歴が残せるから嬉しいけど、永久に残せるわけではないから困るな。他に無制限にバージョンを残せる方法はないんだろうか。」

シズクエリ: 「そうね、ストレージの容量と運用コストの関係で無制限は難しいわ。でも、Gitベースのブランチ機能を使えば、長期間バージョンを残せる方法があるの。ブランチから新しいブランチを作れば、時間無制限で過去の履歴を残せるわ。」

のびデータ: 「へぇ、ブランチがあると長期的にバージョン管理できるんだね。単純に期間を延長するより、ブランチを使った方がいいかもしれない。ノートブックのバージョン管理は制限があることを知って、上手に活用することが大切なんだね。」

ジョブアン: 「その通りだ。バージョン管理の保持期間と料金設定の制限を把握しておくことは、DBAにとって重要な知識だぜ。上手にブランチを使ってコストを抑えることも仕事のうちだ。」

のびデータ: 「DBAってなんだっけ?」

スキーマオ: 「そんなことも知らないのか。DBAはDatabase Administratorの略。データベースの運用・管理を行うエンジニアのことだぞ。データの保持期間や容量、バックアップ、パフォーマンスチューニングなど、データベースを円滑に動作させる役割があるんだ。」

のびデータ: 「なるほど、DBAはデータベース運用のプロフェッショナルなんだね。バージョン管理の制限もしっかり把握しているんだろうな。データの専門家だから、そういう知識があるのは当然か。データベースの管理は難しそうだけど、将来役に立ちそうだ。ありがとうみんな!」

<補足>
Databricksのノートブックでは、デフォルトの履歴保持期間は30日間です。ワークスペースの設定で最大1年まで延長可能ですが、ストレージ容量に応じた料金が発生します。ブランチを活用することで、より長期のバージョン管理が可能となります。制限を理解してコストを抑える運用が重要です。

注意書き: キャラクターの会話はイメージをつかみやすくすることを優先しているため、一部正確ではない表現があります。ご了承ください。Databricks Certified Data Engineer Associate試験の合格に向けて役立てていただければ幸いです。

この記事が気に入ったらサポートをしてみませんか?