AWS:Redshift触ってみたよ
みなさん、こんばんは。ちゃみみです。
今日は、Redshiftを軽ーく触ってみたのでその記録を残したいと思います。
どうしてもデータアナリティクスやデータベースあたりの専門認定の資格では、出てきやすい要素のサービスではあるので一度ハンズオンもかねて触っておきたいというところもありという感じですね。
そもそもRedshiftって、、ってところからなんですが、まずその概要から書いていくと、
原文ママ===
Amazon Redshift は、クラウド内でのフルマネージド型、ペタバイトスケールのデータウェアハウスサービスです。数百ギガバイトのデータから開始して、ペタバイト以上まで拡張できます。これにより、お客様のビジネスと顧客のために新しい洞察を得る目的でデータを使用できるようになります。
===
URL:https://docs.aws.amazon.com/ja_jp/redshift/latest/mgmt/welcome.html
じゃあ、データウェアハウスってなんやねん!って話なんですが、これも掘っていくと
原文ママ===
DWH(Data Ware House:データウェアハウス)とは、様々なシステムからデータを集めて整理する、データの「倉庫」です。DWHではデータが時系列で保存されるため過去のデータ履歴を確認できると同時に、システムごとのデータを集約して全体のデータとして活用でき、より優れた企業の意思決定につながります。
===
URL:https://it-trend.jp/dwh/article/149-0001
じゃあ、データベースやストレージとの違いってなに??ってなると思うんですが、これは一概にどうということはなく、
DWHのポイントって分析用に向いている構造(データ格納)をしているという言い方が一番正しいかなと思っています。
DBだとどうしても、検索する、照会する、、といった具合にDBなりの用途があってその中で分析も、、、ってことはあると思っています。(これはストレージも一緒)ただ、DWHはその中でもとにかく分析のためだけに、、、っていうのが一番主眼に置かれていることもあるのでこの点が大きく違うところかな?と思っています。
ということで、AWSでいうところのDWHのサービスである、Redshiftを触ってみました。
まずはRedshiftのダッシュボードに移動してクラスター作成をしてみましょう。
今回は、一応サンプルですが本番のノリが欲しいので本番さながら仕様で作成してみました。
とりわけ、試験で関連として出やすいのが拡張VPCルーティング、スナップショット(クロスリージョンに置くには?など)が結構問われたりします。
あとは、下記もそうですが監査ログ設定もそうですね。これってRDSなどとは違って作成時に設定できるのではなくて、クラスター作成後に監査ログを取る?取らない?ってのを選択できるようでその場所も確認しておきましょう。
基本的には、RedshiftのログはS3に格納する前提なのであらかじめバケットを作成しておくことをおススメします。
拡張VPCルーティングですが、AWSナレッジでは
原文ママ===
Amazon Redshift は Amazon VPC サービスに基づく Virtual Private Cloud (VPC) を介して、クラスターとデータリポジトリ間のすべての COPY と UNLOAD トラフィックを強制します。
===
URL:https://docs.aws.amazon.com/ja_jp/redshift/latest/mgmt/enhanced-vpc-routing.html
まぁ、簡単に言えばRedshiftに関するトラフィック(COPYとUNLOAD)は、構成されているVPC内を強制的に通過するようになるのでセキュアに通信させることができますよってな感じで書いてます。
意味合い的にはEndpointと近いようなイメージを持ってもらえればわかりやすいかなと。
これが試験では、なんのきなしに聞かれたりとかあとは、ログってCloudtrailでもいけるんけどどっちがいいの?みたいなのもあったりとするので監査ログって中身何?みたいなところはしっかり把握しておきたいところですね。
ちなみにRedshift監査ログは、
原文ママ===
接続ログ – 認証試行、接続、および切断をログに記録します。
ユーザーログ – データベースのユーザー定義への変更に関する情報をログに記録します。
ユーザーアクティビティログ – 各クエリを、データベースで実行される前にログに記録します。
===
URL:https://docs.aws.amazon.com/ja_jp/redshift/latest/mgmt/db-auditing.html
このユーザーアクティビティログが私も間違えてましたが、Cloudtrailでもイケるんでは?と思ってしまって勘違いを起こすポイントでもあるのでしっかりと押さえておきたいところですね。
2021年10月25日
以下、宣伝です。
仲間も募集中なので、気になる方は↓の記事を覗いてみてくださいませ。
いい会社だと思いますよ。