![見出し画像](https://assets.st-note.com/production/uploads/images/117247678/rectangle_large_type_2_7b198c197a1d070fd2cd8f0dfc3ffee2.png?width=1200)
Photo by
tadashikoizumi
Airbyte使ってみた
Airbyteとは
Airbyteとは、さまざまなデータソースからデータをデータウェアハウスやデータレイク、データベースに統合することができるオープンソースのデータ統合エンジン。AirbyteはELT(Extract, Load, Transform)EとLの部分で、データソースからデータを抽出して、目的の場所にロードした後に、必要に応じて変換処理を行うことができる。
インストール
git clone https://github.com/airbytehq/airbyte.git
cd airbyte
./run-ab-platform.sh
※localhost:8000でアクセス
初期ユーザーとパスワードは airbyte / password
.env で書き換え
CSVからMysqlへのデータ登録を試してみる
CSVコネクターの設定
![](https://assets.st-note.com/img/1695688407646-RUznj2a4oH.png?width=1200)
![](https://assets.st-note.com/img/1695712378745-lnpdWiGEw5.png)
gcsの場合 Service Account JsonはJsonをそのまま貼り付け、URLはgs://で始まるURLを指定
Reader Optionsは区切り文字やヘッダー、必要なカラムを指定
MySQLコネクターの設定
![](https://assets.st-note.com/img/1695712533341-WERRbYSOjV.png)
設定
![](https://assets.st-note.com/img/1695712631676-B7JDlyUbAe.png?width=1200)
![](https://assets.st-note.com/img/1695712656719-344UmqWbey.png?width=1200)
![](https://assets.st-note.com/img/1695712830675-gRJGRzfkFe.png?width=1200)
#主に確認した箇所
Replication frequency:レプリケーションの頻度(手動ならmanualを選択)
Activate the streams you want to sync:同期したいカラム
Normalization & Transformation:Normalized tabular dataを選択しておかなければ、データは同期されない
同期の実行
![](https://assets.st-note.com/img/1695713103349-VIpqs5zGCB.png?width=1200)
![](https://assets.st-note.com/img/1695713183791-QBGTXZBc9F.png)
正常に同期ができれば指定したデータベースの中に、ストリームの指定した名前が付いたテーブルが作成され、CSVのデータがMySQLにレプリケーションされたことが確認できる。