ゆるSRE勉強会に参加してきました。
背景
SREの新設された勉強会があるということで参加してきたので、その内容のフィードバックを記憶が新しいうちに残しておこうかと思います。
参加した勉強会
オンコールの交代制は制度や仕組みが第一
ほんとそれですね。弊社のプロダクトの性質的に24365で稼働する必要があるというのと、専門的な知識が必要になるためおいそれとアウトソーシングできないというのがあります。当番制をしくというのは特定の人だけに負荷がいかないようにするため、そして自身がかかわっているプロダクトやサービスへのオーナーシップ向上も見込めるいい施策だと思っています。なので誰でもオンコール対応ができる仕組み作りを行ってからいくのがよいと強く感じました。
開発と運用の壁
別の言い方をするとアプリケーションエンジニア(開発)とインフラエンジニア(運用)の壁ですね。やはりチーム方式で会社の組織を運用しているとそこの壁は現れてきますねw 双方が何をやっているかわからないから壁ができやすいのかなと感じるのでその壁を壊す意味でも各チームの知識をアウトプットするような社内勉強会の施策はいいなと感じましたし、弊社でも取り入れていきたいですね。 (弊社でAWSはどのように使われているのかというのをやろう、いや、やる。)
AIの時代
AIの成長はもういうまでもないですね。ITに関わらず、どの業態でも使うのが当たり前になってきたといっても過言ではないのでしょうか。Azure OpenAI Serviceは以前別の勉強会に参加したときにも話題にあがっており、社内でも検討したい事項で個人的に考えてしたので、制限事項など非常に参考になるセッションでした。AWS のBedrock、Google Bardなどのアップデートも今後気になるところです。
SRE夕会の効果
内容はその日にでたエラーについて全て分析するというものでした。
弊社もデイリーで毎日MTGは行っているのですが、各自の進捗、予定、困っていること のみの共有でエラーについては週単位になってしまっていて、
調査が長引くとログを追うのが大変になってくるという面がありました。その夕会はSREメンバーじゃない人でも参加可能ということで前述にある開発者と運用の壁の緩和にもなるんじゃないかなと思いました。
Datadog入れてみたらAWSの料金が爆発した話
弊社もDatadogを利用しているので非常に興味がそそられる内容でした。ECSのアーキテクチャでDatadogのイメージをDLするときにNatgatewayを経由していることで通信費が爆増するというものでした。VPC EndpointとECRプルスルーキャッシュで対応したとのことで参考になりました。プルスルーキャッシュの導入すすめないと。
まとめ
SRE組織に属しているメンバーの話で課題感も共感する部分が多く、非常に楽しい会でありました。10月に第2回もあるということで楽しみですね。
余談
当日時間通りに行く予定が少し遅れてしまいました。。場所が神田のほうということで、以前から行ってみたいと思っていた らくスパ1010から行こうと計画しました。
ここであればコワーキングスペースもあるし、サウナでさっぱりしてからいけるしと。。案の定ゆっくりしすぎて遅刻してしまいました。
10:00〜 まだSPAがやってないので近くのオープンスペースで仕事
11:00~ ほぼ開店と同時に向かうも列ができてました。ちなみに8月末までは平日でも土日料金。。見落とし
11:00〜12:00 コワーキングスペースで仕事 デイリーもやったけど周りに迷惑だったかも。。次は有料のブース予約します。
12:00〜13:00 昼は食べずにサウナ&銭湯 サウナ → 水風呂を3往復することでととのうっていうんですね。
13:00〜18:00 yogiboがそこらに配置してあるのでyogiboに腰掛けて仕事ドラマ「ユニコーンに乗って」を再現w
18:00〜 サウナ&銭湯
19:00〜勉強会会場に向かう 迷ったのもあり少し遅刻