【インフラエンジニア必見】監視オペレーター(運用監視)時代に失敗したこと
僕が監視オペレーターをやっていたときにやらかしてしまった失敗を語りたいと思います。
新卒で入った会社で3年半程、監視オペレーターをやっていたときの話になります。
このような人向けになります。
・「監視オペレーターってどんな仕事をするんだろう?」と思ってる人
・「運用の人ってどんな作業しているんだろう?」と思っている上流の人
・監視オペレーター(運用監視)の現場レベルの実情を知りたい人
・現在インフラエンジニアの人
※監視オペレーターの仕事について知りたい人はこのnoteを見て下さい。
先ほど、Twitterにてこのようなツイートをしました。
サーバーの時計合わせ作業でこれをやらかしてしまう。
①手が滑った影響でマウスホイールに触れる
②月が一つずれる
③後にひと月前の処理が動いていたことを知る。
それでは、語っていきます。
当時はサーバーの時計合わせ作業を手動でやっていた
今では信じられないと思いますが、サーバーの時計合わせ作業を手動でやっていました。
WindowsServer2003?(WindowsXPのような感じ)の今で古いWindowsデスクトップで作業をしていました。
僕は夜勤(17:15-09:30)で入っており、深夜3:00頃の定時作業で時計合わせ作業がありました。
物凄く眠い時間帯でした。
いつもなら普通通り終わる「時計合わせ作業」で作業をしていたときに悲劇が起きてしまいました。
どんな悲劇が起きたのか
時計合わせをするときです。
知らない間にマウスホイールに触れてしまっていたのです。
マウスホイールに触れてしまった影響でとんでもないことが起きました。
マウスホイールに触れてどうなったか?
サーバーの時計の月がずれてしまっていました。
時計合わせをしていた時には気づくことができませんでした。
昔のWindowsXP時代のサーバーは、時計合わせ画面にいきます。
そうすると、「月」が自動選択されているのです。
「月」が自動選択されていることによって起きることがあります。
それは、「マウスホイール」に触れてしまうと「月」がずれてしまうことです。
例えば、現在の月が「8月」だったとします。
マウスホイールを下に動かすと「7月」になってしまいます。
※こちらのサイトの「Step2」のような感じです。
そのような仕様であることは全く気づきませんでした。
それから、何事もなく夜勤を終えます。
数日後どうなったか?
後日、休日中にチームリーダーから電話がかかってきました。
「システムで大変なことが起きている」
自分は何を言っているのかよくわかりませんでした。
「どんなことが起きているんですか?」
と確認しました。
そうすると、チームリーダーはこのように言いました。
「サーバーの時計がずれているけど、何か知らないか?」
僕は何も知りませんでしたので、このように答えました。
「身の覚えありません。」
それで電話は終わりました。
どのような影響が起きたか?
後日、出勤したときに自分のミスであることが発覚しました。
ひと月前のジョブが動いたことによって、その月に処理するはずのデータが飛んでしまっていたのです。
当時は、POSシステムの運用をやっていました。
POSシステムでは、売上データ等のデータを処理しています。
そのデータの売上データの今月分が飛んでしまったのです。
「ああ、僕はなんてミスをしてしまったのだろう」
と後悔しました。
どんな改善をしたのか?
当時は時計合わせを自動でできるしくみ(インターネットと同期)ができませんでした。
どうしてもインターネット経由ができないので、先輩と協力しこのようにしました。
①バッチファイルを起動
②コマンドプロンプトが起動する。
③手動で年月日を入れる
このようにマウスホイールがずれても問題ないように手順を変更しました。
このときに何を学んだか?
・仕事では「もうやりません!気をつけます!」が通用しないということ
・別の人がやっても「ミス」がないようにしなければいけないこと
まとめ
・監視オペレーターの仕事は、「繊細」である。
・「ミス」に精神論は通じない
・次に他の人が同じ作業をしたときに「ミス」しないように設計することが大事
・少しの操作で大きな影響が出てしまう仕事である。
ここまで読んで頂き有難うございます。
Twitterも登録しておりますので、気に入った方はフォローをお願いします。
よろしければサポートお願いします! あなたにとっていい記事を一つでもかけるように日々勉強していきたいと思います!