元システム運用監視業務経験者が運用監視の一日がどんなものなのか教えます
見て頂き有難うございます。
こちらの記事でも書いておりますが、
運用監視業務を深堀していきまして、
僕が経験した僕が経験したシステム運用監視業務の一日のタイムスケジュールを書きます。
※5年以上前なので覚えている範囲でとなります。
この記事を読むと、運用監視のおおまかな仕事内容等がわかります。
IT業界を志している人が読んだらタメになるんじゃないかなと思います。
当時のおおまかな仕事内容
〇Windowsサーバのバッチ処理
GUIを手順書通り操作する作業
〇帳票の印刷・発送
A4サイズの帳票を大量に印刷して、まとめてバイク便にて発送
〇アラート対応
アラートが鳴るとパトランプが鳴るしくみになっているので、
対象のWindowsサーバにログインして手順書通り以下を確認
・起動状態
・Windowsのイベントログ(エラーが出ていないかどうか)
手順書通り試せることは試し、ダメならメール報告や担当者へ電話連絡
〇サーバーのランプ状態確認
定期的にマシンルームへ行き、エラーのランプが点灯していないか確認
点灯している場合は、ログを消す等の簡単な作業は実施するが、
それ以外はベンダーへ報告
〇バックアップテープの交換・バックアップ
1.決まった時間にサーバールームへ行きバックアップテープの交換
2.テープへ指定されたデータのバックアップ
3.①②の繰り返し
〇システム検証作業
この場ではコンプライアンスに引っかかるため詳しくは言えませんが、システムの検証作業もやってました。
基本SEが作成した手順書通りで、何かあれば電話とかで連絡するスタンス
〇データセンター入館者申請・アテンド
・データセンターへ作業で来るベンダーさんやお客様の入館情報登録
・入館者をマシンルームへアテンド・ラックまで案内
勤務体系
24時間365日のシフト勤務。二交代
日勤:9時~17時30分(2人~3人)
夜勤:17時15分~9時半(2人)
日勤が7時間半に対して、夜勤が16時間くらいと圧倒的に長いです。
メンバー:10人ぐらいで回してました。
勤務場所
データセンターの中のオペレーションルーム
※データセンターとは、簡単に言うとサーバーやスイッチ等のネットワーク機器を設置している場所です。
雰囲気的には以下
・データを守る場所のため、窓がなく外が見えないようになっている。
・入館するまでのセキュリティが厳しい
・パソコンのモニターがたくさんあります。(監視室のような感じ)
タイムスケジュール
【日勤】
08:30-09:00 (忙しさ:高)
手順書を決まったバインダーへ挟む。仕事の準備
少し僕は準備のため早めに行ってました。
09:00-09:30 (忙しさ:高)
夜勤者から日勤者へ業務引き継ぎ
内容としては以下
・夜勤で発生した緊急性のあるアラートについて
・日中で報告してほしいこと/やってほしいこと
・テープバックアップの状況について
・他共有事項なにかあれば
09:30-12:00(忙しさ:高)
確認の時間があるので、時間になった場合に手順書に従い以下を実施
・サーバーにてシステムにエラーが発生していないか確認
・サーバーが起動していて、マウスカーソルを動かしてみて動くかどうか
・バッチ処理が止まっていないか確認
・エラーが出るとパトランプが鳴るので、優先的に確認
※エラーが出まくるとパトランプが止まらないので個人的にきついです。
〇データセンター入館者申請・アテンド
12:00-13:00
昼休憩(この時間が厳しければずらします)
※障害に備えるので外に食べにいけなかった。。。。
13:00-17:15(忙しさ:低)
時間通り作業を実施
・サーバーにてシステムにエラーが発生していないか確認
・サーバーが起動していて、マウスカーソルを動かしてみて動くかどうか
・バッチ処理が止まっていないか確認
〇システム検証
隔週で入ります。手順書通り実施。問題あれば報告
〇マシンルームにて以下実施
・サーバやネットワークのランプ状態確認
・バックアップテープの交換・バックアップ実施
17:15-17:30
日勤者から夜勤者へ業務引き継ぎ
【夜勤】
17:15-17:30(忙しさ:低~中)
日勤者から夜勤者へ業務引き継ぎ
内容としては以下
・日勤で発生した緊急性のあるアラートについて
・夜勤でやってほしいこと
・テープバックアップの状況について
・他共有事項なにかあれば
17:30-22:50(忙しさ:低)
時間通り作業を実施
・サーバーにてシステムにエラーが発生していないか確認
・サーバーが起動していて、マウスカーソルを動かしてみて動くかどうか
・バッチ処理が止まっていないか確認
22:50-01:30(忙しさ:高)
※ここからがヒートアップしてきます。
時間通り作業を実施
・サーバーにて各種バッチ実行作業(量が多くミスもできないので、一番きつかったです。)
※20台ぐらいのWindowsサーバへログインし、10分かかるバッチ実行作業を1台1台やってました。
・他サーバーの動作確認等
01:30-02:00
休憩(仮眠なし)
02:00-03:00(忙しさ:中)
・22:50~実施したバッチ処理の結果を随時確認
・他エラーログ確認
03:00-04:00(忙しさ:低)
〇マシンルームにて以下実施
・サーバやネットワークのランプ状態確認
・バックアップテープの交換・バックアップ実施
※いい気分転換になってました。
04:00-09:00(忙しさ:高)
・22:50~実施したバッチ処理が続々と完了するので、随時確認
・監視結果報告メール作成・送付(これの量が15通くらいあったのでしんどかった)
09:00-09:30
夜勤者から日勤者へ業務引き継ぎ
まとめ・感想
・基本的に手順書通りのルーティンワーク(サーバの確認等)
・ここの現場は仮眠がなかった。。。
・マシンルームへ行くときはいい息抜きになった。
・単純作業だがミスすると影響が大のため、精神的にしんどかった。
・サーバ作業に対する慎重さというものが身についた。
ここまで読んで頂き有難うございました。
他にも運用監視業務についてはインフラエンジニアとしてのキャリアハック等を発信していきます。
この記事が気に入った場合はツイッターのフォローも宜しくお願いします。
Twitter @satton6987