![見出し画像](https://assets.st-note.com/production/uploads/images/107473903/rectangle_large_type_2_dc3a14a01300ea695c1de8366572ab43.png?width=1200)
Amazon EMR
〇Amazon EMR
クラウド上でビッグデータ処理を行うためのマネージドサービスです。Hadoop、Spark、Prestoなどのオープンソースフレームワークをサポートし、大規模なデータセットの処理、分析、機械学習を高速かつスケーラブルに実行できます。
〇ユースケース
1.ビッグデータを活用する
統計アルゴリズムと予測モデルを使用して大規模なデータ処理と what-if 分析を実行し、隠されたパターン、相関関係、市場動向、および顧客の好みを明確する
2.スケーラブルなデータパイプラインの構築
ソースからデータを抽出し、大規模に処理して、アプリケーションとユーザーが利用できるようにする
3.リアルタイムデータストリームの処理
ストリーミングデータソースされるイベントをリアルタイムで分析する、高い可用性、耐障害性を備えた長時間の実行に対応するストリーミングデータパイプラインの構築
※ストリーミングデータ:数千ものデータソースによって継続的に生成されるデータ
※イベント:実行中のプログラムの外部で発生した事象や、その事象を通知するメッセージ
4.データサイエンスと機械学習の採用を加速する
オープンソースの機械学習フレームワークを用いてデータ分析