[さくらインターネット Advent Calendar 2023 Day19] さくらの新卒インフラエンジニア #とは
初めまして!さくらインターネットAdvent Calendar 2023の19日目の記事を書かせていただく2023年の新卒入社エンジニアの藤澤と申します。
本記事では、さくらインターネットの新卒で入社したエンジニアが未経験でインフラチームに参加して、配属から約5ヶ月でどんな業務に携わったのか、その内容について書きたいと思います。
業務について全ては書けないので、3つピックアップして書いていきたいと思います。
このような内容の記事を書こうと思った理由
理由は主に3つあり、
・特定の技術の内容の記事を書くか迷いましたが、新卒らしい記事は今年しか書けないんじゃないか、今年だからこそ良いんじゃないかと思ったこと。
・私が昨年就活をした際、さくらインターネットの社員が実際にどのような業務をするのか、具体的に知る機会が無かったのが気になっていたこと。
(実際、入社後も今のチームにジョインして業務に携わるまでの約3ヶ月間何も分かってなかった)
・2023年の新卒でインフラ開発に携わるエンジニアが私のみで、チームとしてもここ数年の新卒社員が現在おらず、このような記事が自分にしか書けないこと。
就活や転職を考えてたり、純粋に会社について気になった方の参考の1つになったら嬉しいです。
簡単に自己紹介
現在は、さくらの専用サーバ PHYというサービスを支えるインフラエンジニアとして勤務しています。(まだチームにジョインして半年も経っていません)
さくらの専用サーバ PHYは、さくらインターネットの物理サーバー専有クラウドサービスです。
部署としては「インフラ開発グループ」というチームに所属していますが、最初は「インフラで開発…何をするんだろう?」とか思っていた記憶があります。
入社前は、主にC言語を書いており、レイトレーシングなどのグラフィック系のプログラムを作るなどしていました。
また長期のインターン生として、某大学附属の人工知能研究所にて機械学習エンジニア、リサーチアシスタントとしてゼロショット学習について研究をしており、Djangoを利用して1人で英語学習用のアプリの開発をしていました。
バックエンド寄りの経験が多くインフラに関しては未経験でしたが元々興味があり、
「せっかくサーバー屋のさくらインターネットで勤務するなら…」
とインフラに挑戦を希望(話すと長いから割愛)
ぶっちゃけ学生時代にバックエンド系の技術イベントで声をかけていただくまで、さくらインターネットのことは知らなかったです!笑
実際の業務について
BIOSとBMC(iRMC)のアップデート
ここからが本題です。
これを一つ目に選んだ理由としては、私がチームに参加して初めてチケットを切って行った業務だからです。
(弊チームでは、Redmineを活用したチケット駆動開発が採用されています。)
背景としては、2023年8月頃に公開された、Downfallと呼ばれるintel製CPUに起因する脆弱性の対応の一環として、提供しているサーバに対してBIOS、BMC(iRMC)のアップデートが必要になったことでした。
チームのMTG中に誰か対応してくれる人いませんか?という話があったので、何も知らんけどとりあえず手をあげてみたという感じです。
チームに入ってからのマネージャーとの面談で、「何も分からなくても、やりたいことに挑戦してみていいよ」と背中を押してくださっていたので躊躇なく挑戦できました。
内容としては、BIOSとBMC(iRMC)のファームウェアバージョンのアップデートに伴う変更点への対応、動作確認などの検証をすることになります。
そもそもなぜこのような検証が必要かというと、主に、アップデートすることで発生する差分を確認するためです。
例えば、これらをアップデートしたことで消えたり増えたりする設定項目が存在する可能性があります。
もし差分があった場合に手を加えなければ、設定項目の差異などでサーバーの構築スクリプトが走らなくなったり、お客様が元々使っていた設定が利用できなくなったりする可能性があるためです。
主な流れとしては、
1.検証環境構築
2.リリースノートの確認
3.差分の調査
4.差分修正用のパッチ開発(今回はPythonで開発しました)
5.初期設定の定義
6.動作確認
7.デプロイに向けたあれこれ、マニュアルの更新、周知など
という感じです。長くなるので細かくは説明しません。
これに加え、初めてこの作業をする人でも分かるような社内向けのマニュアルも勝手に作成して、自分の理解度も深まって良かったです。
出番があるかは知らない。(笑)
脆弱性に対する対応ということもあり、のんびりと仕組みも勉強しながら、、、とかいう余裕はありませんでしたが、チームの先輩がメンター的な感じで、他の機種での同対応を並走しながら流れをある程度解説してくださいました。
その先輩の作業に向き合うにあたって必要な観点や記録の仕方、チケットの切り方、仕事の丁寧さを学べたことは自分にとってこのチームに入って最初で最大の幸運だったと思います。
例えば、開発チケットに作業ログを記録する際に
・「結果として何が起きたか」だけを記録するのではなく、「何を実行した結果、何が起きたか」を書くこと。出力だけではなく、入力を残すこと。
・自分が後で見返して分かるように記録するのではなく、関係ない他の人が後から見返しても分かるように書くこと。
・そのタスクチケットの目的が何なのか、1文ではっきりと分かること。
-> 分からなければ、さらに分解の余地があるのではないか?
等々気を付けるポイントを学びました。
すべて書ききれはしませんし一見当たり前のように聞こえますが、実際にチケットにログを書き残していくと、慣れていけばいくほどこのような意識を保ち続けることは簡単な事ではないと思っています(現在進行形)。
メンターをしてくださった先輩には、「いつでもなんでも、同じことでも聞いてもらっていい」と言っていただいたことも、入ったばかり&初業務でビビり散らかしていた自分にはとてもありがたいものでした。
自分も今後後輩ができた時にはそうあろうと思います。
一つの業務としてだけではなく、仕事に対する向き合い方、進め方といったところも学ぶことができたのはとても大きなものでした。
専用サーバPHYコントロールパネルから簡単にOSをインストールする機能の開発
さくらの専用サーバ PHYでは、コントロールパネルからボタン一つでOSを選択インストールができる機能を提供しています。
今回改めてその機能の開発が必要となった背景としては、提供している16コアサーバーのモデル改定に伴って、新たなサーバーモデルに対応したOSインストール機能の開発が必要になったためです。
OSインストールをセットアップするためのスクリプトを作成しつつ、インストールの検証を繰り返す中で、不具合が起きていないかを確認します。
syslog等のlogファイルを中心にerrorからwarning、fail等の問題を吐いているログを都度確認していきます。
エラーを解消するため、エラーの内容からOSセットアップ用のファイルから定義するべきこと・しないべきことを洗い出し、検証機に対してのOSインストールとログの確認、スクリプトの修正、を繰り返します。
また、今回の新モデルのサーバーでは、各OS共通でbootorderが意図しない挙動をする不具合があり、その検証に時間を割きました。
細かく書くと長くなるので、内容については割愛します。
結果としては、OSインストールセットアップの後半にbootorderを強制的に上書きする処理を入れ込むことで不具合を回避することができましたが、サーバー依存の不具合に対処しつつ機能を作っていく難しさを経験することができました。
新卒エンジニアでも注目度の高い新サービスに参加できる!?
注目度の高いサービスとは、生成AI向けクラウドサービスになります。詳しくは以下の記事を参照ください!
さくらインターネット、生成AI向けクラウドサービス開始へ
〜NVIDIA H100 GPUを搭載した2EFの大規模クラウドインフラを石狩データセンターに整備〜
NVIDIA H100 GPU…凄まじい規模。経済産業省から認定…大きな責任感。
新卒でもこの規模のプロジェクトに参加させていただけるなんて思ってもいなかったです。本当に貴重な経験になっています。
10月に行われた石狩iDCでの実際の設置作業の雰囲気はこちらの田中社長のX(旧Twitter)に投稿されたツイートより見ることができます!
実は自分も映ってます笑
この時は設置だけだったのですが、のちに実際にサーバーに接続することも経験できました。
このような貴重な場に立ち会えたことは入社タイミングも、やりたいことを目指せる配属を会社がしてくださったことも、全て揃わなければ実現しなかったので本当に良かったと思います。
この時は新卒エンジニアの中で自分のみが参加だったのですが、同じ部の新卒エンジニアも興味を持っていたので、機会を作って巻き込みたいな、、、と思ったりもしています。
実はこのアドベントカレンダーが公開された翌日から10日間ほどまた石狩でこのプロジェクトに関わる設置や配線の作業に従事します。
これからも頑張ろうというモチベーションにもなりますし、このような機会を与えてもらえる新卒社員はとても幸せなんじゃないだろうかと思います。
終わりに
まとめ
毎日「何もわからん」と「完全に理解した」をいったりきたりしてますが、とにかく楽しいですし、力と知識もついてきています。
3つ目に紹介したGPUの件は特に「ジョインして間もない新卒の自分が、こんなに貴重な経験をさせてもらえるんだ」という感動もありましたし、さくらインターネットじゃないとできない経験だと感じました。
日々の業務や勉強のモチベーションにもなりました。
(少なくとも私の所属しているチームでは)困った時には、先輩方も時間を割いてフォローしてくださいますし、何でも相談できる機会も多いです。
勤務する中で1人で困って抱えることは無く、やりたいことや自分のやるべきことに集中して成長できる環境だと思います。
もちろん大変なこともありますが、険悪な雰囲気には出会ったことはないです。
ただ、フルリモートで実際に社員同士会う機会が少ない分、必要な時にはしっかり自分からチャットや通話で話しかけに行ったり、やりたいことを伝える積極的な姿勢が大事だと思います。それができればこの上ない環境だと感じています。
ex:もしこの記事に辿り着いた、就活中の学生さんがいらっしゃったら、、、
私は初めて技術に触れたのは2020年の秋で、元々文系で法律学部の出身です。
さくらインターネットには、まずは相手を肯定するという文化があり、
採用面接時には、技術に触れてから2年も経っていないような文系の自分にも否定することなくチャンスを与えてくださいました。
経歴は様々だと思いますが、迷っている人がいれば、ぜひまずはカジュアル面談や、採用を受けてみて、自分のやりたいことを伝えてみてほしいと思います。
以下のリンクから25年度新卒向けの募集要項の確認、応募ができますので、ぜひご確認ください!
新卒採用 募集要項(25卒)
最後になりますが、就活をする学生さんだけでなく、さくらインターネットに興味を持ってくださっている方に少しでも雰囲気などが伝われば嬉しいと思います。
そしてもし応募してくださった時には、一緒に働けたら嬉しいなと思います!
さくらインターネットでは新卒だけでなく、中途のエンジニアの方の採用も強化しております!
もしご興味があれば、以下のURLを参照いただけますと嬉しいです!
https://www.sakura.ad.jp/lp/22engineer/
記事を読んでくださり、ありがとうございました。