読書記録 AWSではじめるデータレイク
GWが10連休になったので、連休直前にまとめ買いしていた本の1冊目
この本が出版されたのは2020年7月、技術書において2年近くの年月は決して小さくないのですが、当時の自分はこの分野にはさほど興味を持てておらず、どこか別の世界の話にさえ聞こえてしまうくらいの距離を感じていました。
ここ1年くらいはAWSの新サービス新機能の発表を追いかけるのがすっかり趣味になっています。データ分析関連のサービスも最初は名前を聞いたことがある程度だったものが、新機能を理解するためにはそのサービスの概要を知る必要があり、出てくるたびに記事を読むなどして学ぶ中で一番興味が湧いてきたのがこの分野です。先日AWS認定資格を取得し、AWSの基本的な考え方が見えてきたところで、さらにデータレイクを学び始めるには、ちょうどよいレベル感でした。
第1部、「データレイクの概念と知識」
クラウドの利用が広まるすこし前、オンプレミスで大規模なクラスターを組んで分析していた頃の話から、なぜデータレイクが必要とされているのか、それをAWS上で効率よく実現するための仕組みの概要がまとめられています。
試験勉強で得た知識と、デベロッパーガイド等の資料、ハンズオンで実際に手を動かして得た体験、そして最新のサービスアップデート情報、これらがこれまでは断片的な知識として存在していたのが、一つのストーリーとなって見えてきたような感覚があります。
どんなに良い情報や他人からのアドバイスでも、必要としているタイミングで出会わなければ刺さらないという話を思い出して、まさに今このタイミングでこの本を読んで良かったと思いました。
それぞれのサービスの特徴や役割が見えただけで、最初の一歩を踏み出したにすぎないですが、もう少し深く学んでみようと思います。