見出し画像

Databricks(Associate)一発合格予想問題集(問題1~10)

記事単体よりもマガジンのほうがお得となります。ぜひ有料マガジンもご検討ください。




問題1


SQLを使用してDelta Live Tables(DLT)テーブルを作成する際に、CREATE LIVE TABLE構文ではなくCREATE STREAMING LIVE TABLE(以前のCREATE INCREMENTAL LIVE TABLE)構文を使用するのはどのような場合ですか?

A. CREATE STREAMING LIVE TABLEは、データの変更が頻繁に発生する場合に使用されます。
B. CREATE STREAMING LIVE TABLEは、データを増分で処理する必要がある場合に使用されます。
C. CREATE STREAMING LIVE TABLEは、テーブルのデータ更新を定期的に行う必要がある場合に使用されます。
D. CREATE STREAMING LIVE TABLEは、大規模データセットを効率的に処理する必要がある場合に使用されます。
E. CREATE STREAMING LIVE TABLEは、パイプラインでのデータのリアルタイム分析が必要な場合に使用されます。






 
 


解答


B. CREATE STREAMING LIVE TABLEは、データを増分で処理する必要がある場合に使用されます。

解説


CREATE STREAMING LIVE TABLE構文は、データをリアルタイムまたはほぼリアルタイムで増分的に処理するシナリオに適しています。この構文を使用することで、新しいデータが到着するたびに、それを効率的に処理し、テーブルに反映することができます。

他の選択肢についての説明:
A.、C.、D.、E.は、CREATE STREAMING LIVE TABLE構文の使用目的を正確に反映していません。CREATE STREAMING LIVE TABLEは、特にデータが増分であり、連続的な処理が必要な場合に有用です。




問題2


データエンジニアがデータパイプラインを設計しています。ソースシステムは共有ディレクトリにファイルを生成しますが、このディレクトリは他のプロセスでも使用されています。そのため、ファイルはそのまま維持され、ディレクトリ内に蓄積されます。データエンジニアは、前回のパイプライン実行以降に新たに追加されたファイルを特定し、それらの新しいファイルだけを各実行で取り込むようにパイプラインを設定する必要があります。この問題を解決するためにデータエンジニアが使用できるツールは以下のうちどれですか?

A. Unity Catalog
B. Delta Lake
C. Databricks SQL
D. Data Explorer
E. Auto Loader

ここから先は

6,490字
この記事のみ ¥ 980

この記事が気に入ったらサポートをしてみませんか?