Databricks(Associate)一発合格予想問題集(問題11~20)
記事単体よりもマガジンのほうがお得となります。ぜひ有料マガジンもご検討ください。
https://note.com/data_ku/m/m523f94d5d2b8
問題11
あるデータエンジニアは、複雑な実行スケジュールを持つジョブがあり、そのスケジュールを他のジョブに適用したいと考えています。Databricksのスケジューリングフォームで各値を手動で選択する代わりに、データエンジニアがプログラム的にスケジュールを表現して提出するために使用できるツールは以下のうちどれですか?
A. Apache Airflow
B. pyspark.sql.functions.current_date
C. Scalaのケースクラス
D. Cron syntax
E. この情報をプログラム的に表現し提出する方法は存在しない
解答
D. Cron syntax
解説
Cron構文は、UNIX系システムで広く使われているスケジューリング構文で、特定の日時や周期でジョブを実行するための設定を表現するのに適しています。Databricksでは、Cron構文を使用してプログラム的にジョブのスケジュールを設定することができます。
他の選択肢は、ジョブスケジューリングのための設定表現には適していません。
AのApache Airflowはワークフロー管理ツールですが、Databricksのスケジュール設定に直接使われるものではありません。
Bのpyspark.sql.functions.current_dateは日付データを取得する関数ですが、スケジュール表現には使用できません。
CのScalaのケースクラスはプログラミングのデータ構造であり、スケジューリングには関連がありません。
Eは、プログラム的な方法が存在しないことを示していますが、実際にはCron構文を使用してスケジュールを設定することが可能です。
問題12
データエンジニアが、sampletable400というテーブルにアクセスする必要がありますが、適切な権限を持っていません。彼らはテーブルの所有者に権限を求めることができますが、所有者が誰であるかはわかりません。
以下の方法のうち、sampletable400の所有者を特定するために使用できるのはどれですか?
A. Databricksのテーブルのページで所有者タブを確認する。
B. データベースのメタデータを確認する。
C. Data Explorerのテーブルのページで所有者フィールドを確認する。
D. クラウドストレージサービスのテーブルのページで所有者フィールドを確認する。
E. テーブルの所有者を特定する方法はない。
この記事が気に入ったらチップで応援してみませんか?