
2024年振り返り
インフラエンジニアになった
昨年までバックエンドエンジニアとして新規プロダクトの開発を行なっていましたが、リリース後落ち着いてきたため、今年からインフラエンジニアに挑戦させていただきました。
私がインフラエンジニアとしてのキャリアをスタートさせた際、まず取り組んだのはAWS環境におけるコスト増加を検知するアラートの実装です。これによって「気づいたら請求額がとんでもないことに!」ということが起きる心配はなくなりました。
他にも、AWSコンソールへの不審なログインを検知し通知する仕組みを導入しました。こういったことは監査の観点からも必要な取り組みなので、やれて良かったなと思います。
今年から本格的にIaCの普及を開始し、AWS CDKやCloudFormationを活用することで、手動操作のミスを防ぎつつ、効率化を行なっています。まだ置き換えれていないプロダクトも多いですが、少しずつ手を入れていければと思います。
また、AWS勉強会を30回以上開催し、社内のスキル向上にも貢献しました。15分程度の勉強会ですが、毎回「どうやったらみんなに伝わるだろう」と考えながら事前準備をしていました。
AnsibleやDeployerを活用して検証環境を整備し、新しいクライアント用のインフラ環境の構築も担当しました。さらに、Deployerの改修を行い、デプロイ時の不要なキャッシュ削除やロールバック時の安全性向上を図りました。
また、サーバーログのローテーションや定期的なバックアップの仕組みをいくつかのプロダクトに構築し、システムの信頼性を高めるための基盤作りを進めました。
インフラエンジニアとして業務を始めて半年ぐらいですが、AWSで困ったことがあれば、どこのチームからも呼んんでいただけるようになれました。
ずっとバタバタして大変でしたが頼られる存在になれてきたことが嬉しかったです。
3期連続でS評価をいただく
インフラエンジニアとして、各プロジェクトを支える業務に取り組んだ結果、3期連続で最高評価であるS評価をいただくことができました。プロジェクトの信頼性を高め、インフラに関する多くの課題を解決してきたことが評価されたとのことでした。これが自信につながり、次のステップへ進むモチベーションとなりました。
SREやDevOpsの文化を普及させた方が良いと思い始める
今年に入ってバックエンドエンジニアから、横断業務を行うインフラエンジニアに異動したことで、プロダクト全体を俯瞰する視点を持てるようになりました。その結果、以下の課題が気になるようになりました。
システム障害による機能停止がクライアントへ与える影響
レスポンスタイムの基準が存在しないこと
障害が複数プロダクトで再発すること
デプロイツールの一貫性の欠如
ライブラリやフレームワークのバージョン更新の遅れ
インフラセキュリティ基準が担当者任せになっていること
これらを見て見ぬふりをしていては、クライアントから信頼し続けてもらえなくなる可能性もありますし、将来的に技術的負債が増え、組織が変化に弱くなると感じました。そのため、SREチームの発足を提案するための資料を作成し、上司、役員、外部技術顧問にプレゼンを行いました。
その時は「私が社内で旗を振ります!」と勢いよく宣言したのですが、今思うと少し無謀だったかもしれません。それでも、この提案が受け入れられ、私のSRE活動が始まりました。(ガッツが刺さった模様です。笑)
インフラエンジニア兼業で1人SREをはじめる
上司へのプレゼンが功を奏し、1人SREとしての活動をスタートしました。初めて単独でプロジェクトを進める経験だったため、プレッシャーを感じましたが、マネージャー陣と密にコミュニケーションを取りながら、以下の活動を行いました。
信頼性の指標となるデータを収集し、現状を可視化してマネージャー陣へ共有
システムの停止時間やエラーレート、稼働率
ELBで取得したレスポンスタイムのp99やp50
過去のシステム障害履歴を分析し、傾向を把握してまとめる
過去2年分のシステム障害を遡り、原因の分類
AWS環境の脆弱性を調査して、現状と今後の対策を提示
セキュリティ対策の中長期的な方針を策定し、情報セキュリティ部署のマネージャーに提案
AWSセキュリティ成熟度モデルを参考にしながら社内向けの指標を作成
このような地道な活動により、これまでは潜在化していた問題が徐々に可視化され始めました。
SREチームが発足され、専任になる
1人SREとして地道に活動を続けた結果、正式にSREチームが発足され、SREの専任となりました。これは、私のキャリアにとって非常に大きなステップだと感じています。
「SREチームを作りましょう!」と自ら上司や役員に提案し、1人で活動を続ける中で、その姿勢がマネージャーや他の関係者から評価されたのだと思います。そして、「チームとして運営すればさらに成果が出せる」という期待をいただき、今回のチーム発足に至りました。
これからは、チーム全体で成果を出せるよう、一層努力して邁進していきます。
4期連続でS評価をいただく
なんと、4期連続でS評価をいただくことができました。そもそもS評価を出すには、役員会議での説明が十分に必要で容易ではないようですが、評価を勝ち取ってくださった上司に感謝しています。
また、このタイミングでマネジメント職への昇格の打診もありましたが、SREとしての活動に専念するため、現在はお断りしました。これからSRE文化を社内に浸透させ、体制を整えた上で、将来的にはマネジメントにも挑戦したいと考えています。
その他のアウトプット
社内外におけるアウトプットも行いました。

これからの展望
最近では、外部技術顧問とのミーティングを任される機会が増えたり、AWSの担当者と直接話をする機会が増えたりしています。また、採用面接に参加して社内の取り組みを説明するなど、発言力も増していると感じています。
今後さらに技術力を磨き、SREとしての活動を通じて組織全体に貢献していきたいと考えています。