AWS Glue
ETLツール
=データソースから、データ分析基盤に対して、データを統合するときに発生するプロセスのこと。
Ex)CSVファイルをApacheParquet形式に変換など
⚪︎データカタログ:データソースのメタデータを一元管理するためのデータストア。
Glueを管理するためのテーブル定義、ジョブ定義などが含まれる。
⚪︎分類子:データ形式を評価してスキーマを推測する。
⚪︎オートスケーリング機能:あり
ETLツール
=データソースから、データ分析基盤に対して、データを統合するときに発生するプロセスのこと。
Ex)CSVファイルをApacheParquet形式に変換など
⚪︎データカタログ:データソースのメタデータを一元管理するためのデータストア。
Glueを管理するためのテーブル定義、ジョブ定義などが含まれる。
⚪︎分類子:データ形式を評価してスキーマを推測する。
⚪︎オートスケーリング機能:あり