システムトラブルの連絡に時間を使わないようにしようという話
こんにちは、みやびのです。
み〇〇銀行さんがシステムトラブルで大騒ぎになっていますね。
私も使っている銀行なので経過を見守っていましたが、復旧まで結構時間がかかってしまいました。
システムトラブルは2時間を超えると重要度大の問題(と昔いた会社にいた社長が言っていた(笑))ので、結構大事ということになります。
さて、システムというのは365日24時間休みなく稼働しているので、システムトラブルは我々の勤務時間に起こるとは限りません。
土日だろうが、真夜中だろうが正月だろうがやってきます。
システムトラブルは迅速に解決する必要があるので、休日だろうが夜中だろうが対応しなければなりません。
そしてシステムトラブルは解決までの時間が非常に重要です。労働時間外にシステムトラブルが起きた時にいかに素早く問題を解決するか考えておかなければなりません。
今回は、システムトラブルから復旧までの時間が長くなる要因の1つである「連絡」について私の考えを述べています。
システム障害の連絡に時間はかけてはられない
問題が起きた時に意外に時間を使ってしまう可能性があるものが担当者への連絡です。
開発担当者への連絡に時間がかかると復旧に着手するまでにも時間がかかってしまうので、どれだけ復旧作業を素早くやったとしてもトラブルが起きている時間は長くなってしまいます。
なのでシステム復旧への連絡は短い方がベターです。
例えばシステムトラブルが起きた時の連絡が以下のような感じだった場合。
エンドユーザーからクライアントのデスクに連絡がいく
↓
クライアントのシステム責任者に連絡がいく
↓
システム元請会社の開発責任者に連絡がいく
↓
システム元請会社の開発担当者に連絡がいく
↓
一時下請け企業の開発責任者に連絡がいく
↓
一時下請け企業の開発担当者に連絡がいく
↓
二次下請け企業の開発責任者に連絡がいく
↓
二次下請け企業の開発担当者に連絡がいく
※上記は例であり、どこかの企業で実際に行われているものではありません。
上記の例は極端な例です。実際はもう少しスマートだとは思います。
上記のような連絡経路だと連絡だけで数十分、下手すれば1時間2時間かかるかもしれません。担当者がなかなかつかまらないケースならさらに時間を食う可能性もあります。
システムトラブルは連絡している間にも続いています。迅速の対応が必要なので連絡で時間使う構造だとやはり問題。
いかに迅速に担当者へ伝えるか考えることが大切です。
連絡に時間を使わない方法
連絡に時間を使わない方法としては以下の方法があります。
・担当者自身がシステムトラブルに気づける仕組みを作る
・連絡経路を簡略化する
・応急処置を手順化しておく
担当者自身がシステムトラブルに気づける仕組みを作る
最も確実な方法は担当者自身がシステムトラブルにすぐに気づけるようにしておくことです。
これは、Slackなどのツールを活用すれば実現できます。
例えば私が昔いた会社ではシステムトラブルのログが出た際に、Slackに通知するようにしていました。
担当者自身が気づけるようにしておけばすぐに復旧作業に取りかかることができるので復旧までの時間を大幅に短縮することが可能です。
ただし、エラーが出るような問題なら通知すればすぐに気づけますが、エラーとしては検知されないトラブルも起こる可能性もあります。
また、セキュリティの関係で、「外部からSlackにアクセスするのはNG」など外部ではシステム通知を一切受け取れないケースもあると思います。
他の方法の併用も検討しましょう。
連絡経路を簡略化する
連絡経路はできれば簡略化しておきたいです。平常時ならともかく、有事に順番通りに連絡していたら連絡だけで多くの時間を費やしてしまいます。
「クライアント」→「開発元企業の担当者」→「2次下請け会社の責任者」→「2次下請け会社の担当者」くらいの経路であれば担当者への連絡も早くなります。
もちろん他の人に連絡を入れることも大事ですが、まずは一番詳しい人がすぐに動けるように第一報を入れることが大事
応急処置を手順化しておく
すぐに解決できる問題ならよいですが、担当者がなかなか捕まらない場合もありますし、復旧に時間がかかる場合もあります。なので担当者以外でも復旧できる方法を確立して手順化しておいた方がよいです。
終わりに
システムトラブルはいつ起こるかわかりません。業務時間中に起こればすぐに対策できますが、夜中や休日などに起こった場合もあります。
その時時間を食ってしまいがちなのが連絡です。
・担当者自身がシステムトラブルに気づける仕組みを作る
・連絡経路を簡略化する
・応急処置を手順化しておく
上記のように連絡の改善を行って少しでも連絡にかかる時間を減らしましょう。