見出し画像

AWSソリューションアーキテクトアソシエイト奮闘記②Amazon EMRって何?~AWS実務経験なしの営業(非エンジニア、インフラ未経験)がSAA取得を目指す~

こんにちは!
コンビニの秋スイーツ欲が止まらない営業本部の瀧川です。
さつまいも、栗、かぼちゃは正義です。

さて、前回の記事でSAAを年内に取得しますと宣言しましたが、
順調にSAAの勉強をサボっております!!!
非エンジニアには本当に馴染みのない用語が沢山出てくるため本当に捗りません・・

今回はそのうちの1つ、Amazon EMRについて書いていこうと思います。
クラウドプラクティショナー勉強時にも、確かちょこっと出てきていたようなEMR。
しかし、オレンジ本を読むとEMRだけでトピックがあり、理解しないと・・となりました。

1.Amazon EMRとは

オレンジ本にはEMRについて下記のように書かれていました。

Amazon EMRは、分散処理フレームワークです。もともとHadoopを中心としたサービスであり、「Amazon Elastic MapReduce」というサービス名・・(略)

意味不明・・!分散処理フレームワークってなに!?状態です。

2.EMRを非エンジニアなりに理解

以下が参考にさせていただいたサイトになります。

Amazon Elastic MapReduce (Amazon EMR) について調べてみた
[初心者] EMRとは何ですか/とりあえずざっとまとめてチュートリアルしてみる
AWSチーム社内勉強会「EMRおじさんに聞いてみよう」レポート

この3つの記事から非エンジニアなりに強制的に頭の中で理解したものを抜粋してポイントとしてあげます。

・MapReduceとは、Googleが開発した、大規模なデータを効率的に分散処理するためのフレームワーク。必要な計算内容を実装したMap処理とReduce処理を用意して、このシステムにぶっこむとうまいこと分散処理してくれる。
・Amazon EMRとは、Amazon提供のHadoopフレームワークが動作する環境
・Hadoopは大規模データの分散処理を支えるJavaソフトウェアフレームワーク
・サーバー1台の場合に100日かかる処理があったと仮定する。この処理を100台のサーバーで構成されているHadoopを利用することで、処理時間を1日に減らすことが出来る。

3.EMRを非エンジニアなりにまとめる

・EMRは、Hadoopフレームワークが動作する環境
・Hadoopは大規模データの分散処理を行うもので、処理時間を短くできる
→EMRは大量のデータを処理するときに利用すれば良い!

Map処理、Reduce処理、Hadoopの仕組みなど調べれば調べるほど闇に落ちていったので
今回は割愛してこのようなざっくりな知識で失礼させていただきます。
模擬問題など解く中でこの理解が甘かったらまた記事内で書きますね・・。

4.まとめ

ゴルフは惨敗でした!
しかし!11月も1Rと0.5Rの予定が1回ずつあるので!!
乞うご期待ください!!!涙

画像1

(動画のスクショです。)

シースリーインデックス株式会社https://www.c3index.co.jp/
【本社】 〒460-0011 名古屋市中区大須3-30-40 万松寺ビル9F
     TEL 052-265-3770 FAX 052-265-3775
【東京】 〒107-0052 東京都港区赤坂1丁目5-12 第二虎ノ門ビル3F
     TEL 03-6388-9225 FAX 03-6388-9556


いいなと思ったら応援しよう!