初心者からSREエンジニアに向けた第一歩
初めまして
UNIBA Azukaritai新人の白井です。
今回は、新人ITエンジニア(歴2カ月)の私がSRE(Site Reliability Engineering)業務にあたり、まず初めに取り組んだことについてご紹介させていただきます。
【取り組み背景】
私が所属しているAzukaritai には4つの注力分野があり、SREはそのうちの一つに挙げられています。AzukaritaiではSREサービスを以下のように定義しています。
IT未経験の私にとっては、
安定したサービスとは何か?
何を継続的にモニタリングするのか?
どのように運用の改善を行っていくのか?
わかりませんでした。
しかし、Azukaritaiではメンバー一人ひとりの成長を積極的に支援しています。
SRE業務ではその一環として、新人に対して書籍による知識の習得と、ミーティングでのアウトプットを通じた知識の定着を行っています。
私は、チーム内での相談した結果、「インフラエンジニアの基礎」から学んでいこうということになり、それに関する書籍を読むことから始めました。
【取り組んだこと】
以下の書籍を読みました。
「インフラエンジニアの教科書」
著者 佐野裕
発行所 株式会社C&R研究所
本書から得た学びを私なりにまとめてみました。
Chapter 1 インフラエンジニアの仕事
インフラエンジニアの仕事は、おおよそ「インフラ設計」「インフラ構築」「インフラ運営」のフェーズで構成されています。
インフラエンジニアには技術力と責任感はもちろん。情報収集力と決断力が必要とされています。
Chapter 2~5 サーバ、OS、ネットワーク、ストレージ
インフラエンジニアは、サーバをはじめとした各機器の種類や機能を知っていることはもちろんのこと、プロジェクトで必要とされているQCD (Quality:品質、Cost:コスト、Delivery:納期)に合った各機器を手配、設置、運用することが求められています。
Chapter 6~7 購買と商談、データセンター
各機器の購入手配には制約条件があり、インフラエンジニアは複数のベンダーから情報を収集し、ベンダーの選択、またデータセンターの構築場所を決定していかなければなりません。
Chapter 8 ソリューションとセキュリティ
運用フェーズに入る前に、インフラエンジニアにはソリューション導入やセキュリティ対策を行います。ITインフラ管理には、多くの監視ソリューションがあり、セキュリティ対策においてもソリューションの導入から、外部セキュリティ業者者への委託などの多くの選択肢があります。これらはともすると導入自体が目的になってしまいがちです。そこで明確な目的を持って業務に取り組む必要があります。
Chapter 9~10 インフラ運用、大規模インフラ
運用フェーズでは障害の検知と対応、障害の予防がテーマとなっています。
また、大規模インフラは小規模インフラの延長線上にはなく、あらゆるリソースが断続的に不足していくため、優先順位付けを行い、計画的に管理していくことが必要となります。
Chapter 11 インフラエンジニアの成長
日々の業務を淡々とこなすだけでは、成長は得られません。人生設計をもとに柔軟性のある計画を立てていく必要があります。
【学びのまとめと、アウトプット】
IT未経験の私が読んでも、理解ができるレベルの本でした。
当初の疑問も以下のように解消できました。
安定したサービスとは何か?
→ サービスが停止することなく、継続的に使用できる状態になっていること何を継続的にモニタリングするか?
→ 故障やキャパシティなど機器の稼働状況と、セキュリティ状況どのように運用の改善を行っていくか
→ 障害の検知と対応、障害の予防のためボトルネックの解消
一方で、この本を読んですぐに実務に行かせるまでのレベルに到達できるかと聞かれれば、そこまでは難しそうという印象です。
また、現役エンジニアであるチームメンバーに共有したほうがstate-of-the-artな知識が得られるということは残念ながらありませんでした。
【一緒に働ける人を募集しています】
Azukaritaiでは、実務と学びを交互に行いながら、積極的にメンバーの能力開発に取り組んでいます。そして、その能力を生かし、クライアントとともに伴走してくださるメンバーを常時募集しています。現在求人中のポジションはサイトに掲載していますが、Azukaritai に興味がある方であればどんなポジションの方でも一度お話したいと思っています!ぜひお気軽にお問い合わせ下さい!