
情シスと作業計画について
先日から作業が続いております
先日から設備や機器のリプレイス作業が続いております。
今まで落としたことがないサーバを落としたりといった作業があったので、何かあるとしゃれにならんということで、システムを止めたり、いろいろと大きな確認作業が発生していました。
夜間や日曜日の作業入りまくり。

まあいろいろとありますですよ
作業時は、イレギュラーなことは起きると心得るべし!
まあ今回行っている作業もいろいろと起きていますよ。これ自体は、一定はしょうがないと思ってます。
・想定した時間からの作業の遅れ
・切り戻し
・切り戻した後の再計画
最近部内で徹底しているのは、作業計画を時間単位できっちり立てることと、切り戻しタイミングを決めておくこと。
とくに事業所のネットワーク切り替えなんていうのはタイムリミット決まってますからね。
「あと少し、あと少し!」なんてやっていると、切り戻す時間もなくなったりしてどん詰まりになります。

某社さんは遅れるなんてざらですからね。
そもそも細かい時間指定ができなかったりしてね
切り戻しにかかる時間を多めにとっておくべし
失敗したら失敗したで切り戻すんですけど、結構、ここに時間がかかったりするんですよ。。。
私が今まで一番焦ったのは、床が古すぎて貼りついていて開かない事件のときですね。
この時は、ラックの中にあったネットワーク機器の配線自体もめちゃめちゃ古くてですね。断線しそうなケーブルとかあって交換したいんだけど、そのケーブルは床下に続いていて、明らかに幹線だろうと。
それが複数フロアに続いてるの。
で、もともと設置した業者はもう倒産して図面とか残ってなくて、当該箇所は作業範囲外だったもので
「気をつけろ、このケーブルは触るな!」
とか、通常だとないような考慮事項がたくさんあってですね。
まあ結論としては全部事前にチェックしておけば回避できただろうと思ってます。
大きな作業の体制は、早めに議論しておこう
これは先日、私自身がリーディングしていた作業であったやつですけどね。まあインフラ作業なんですけど、アプリケーション側の影響が膨大にわたるので、インフラとアプリケーション側双方でボスを立ててで進めていたわけです。
で、準備がギリギリになるのはわかっていたのですが、弊社、ここ数年でJOINしてくださったSIer出身のリーダーさんたちが何人もいらしてですね。
前の週の幹部会でタイムスケジュールをお披露目したら、この方々から細かい質問が飛ぶ飛ぶ。
「ジャッジポイントはどこですか?」
「ここの役割分担はどうなってます?」
「緊急時の連絡先は、オフラインで皆さん持ってますよね?」
「このタイミングでうまくいかなかったときに、〇〇さんにもスタンバイしてもらいます?」

結局部長が「〇〇君(課長)、君もスタンバイしなさい」と声をかける事態に
結果としては、まあいろんなことがありまして、基本切り戻しができない工事だったものですからめちゃめちゃ胃が痛い状態になったのですが、体制を手厚くしていたおかげで、判断者もいて、なんとか乗り切ることができました。
っつーか、あぶねー。
この議論、2週間前にしとくべきだったわ。
終わった後は死んだように寝ましたからね。
万全の準備でのぞめる切り替えなんて、ほとんどない
最終的にここだと思うのです。
いや、できる会社さんもあると思うんですけど、弊社みたいな中小の事業会社だと、やっぱり体制も100%は無理だし、予算も覚悟されているからある程度の失敗リスクは想定しないと動かなきゃいけないしね。
ちなみに、上の切り替え作業、私マネージャーだけど動作確認も兼ねてましたからね。
ちなみに障害対応の本については、こちらがむちゃくちゃ良書です。何がいいって具体的であること。
ここに書いてあること全部はできないけど、ベストな動き方を知っておくだけで、計画は立てやすくなりますからね。
おしまい。