プロダクトマネージャーとして障害対応で意識していること
障害は起きないに越したことはないですが、色々な要因で起きてしまうものでしょう。もちろん、規模として大きいものから小さいものまで、まさに色々あると思いますが、ユーザーファーストで一刻も早く対応する必要があります。
この記事では、障害対応で意識していることをプロダクトマネージャー目線で著者なりに説明します。
事実の確認
障害が発生した時、まず事実の確認をしっかり行います。
いつ、どのような事象が起きていて、それはどのくらいの範囲で発生しているのかについて明確にします。
その上で、影響からネクストアクションの判断をします。影響が大きく深刻な場合、告知を出してすぐさま解消させるのが良いでしょう。また、ユーザーにほとんど影響がない場合は、不具合として処理して後日直す方が良かったりします。
ここはケースバイケースなので、判断を迅速に行うためにも、まずは事実情報をすぐに収集します。
告知
顧客影響がある場合には、関係者への告知をします。
まず、公式のお知らせとして社外にお知らせをします。何がどういう状況で、復旧に向けて動いている点を、困っているお客様に正しく情報をお伝えいたします。
その上で、担当の営業やCSメンバーに共有します。これは対応が必要な場合は、個別で情報をお伝えさせていただくために実施します。迷惑をおかけしている以上、ユーザーファーストで誠実な対応をすることが大事です。
コミュニケーションを整備
障害が起きているとき、エンジニアが収束に向けて調査・改修に集中できるようにコミュニケーションを整備するのも仕事の一つです。
スレッドなどに現象と状況、原因、対応状況を書いて常にアップデートし、ビジネス側からくる質問を取りまとめます。自分で回答できる部分は回答し、必要に応じてエンジニアに聞くなど、急いでいるからこそ、コミュニケーションを無駄を省き、迅速に対応できる状況を作る必要があります。
問題の収束
問題の収束の見込みが立ったら、改修のリリースを決めて、解消の告知も改めて検討します。
落ち着いたタイミングで、告知のしやすいように時系列ごとに状況や出来事をまとめておきましょう。
振り返り
最後に今回の対応に問題がなかったか、どこがもう少しより良くできたか、今後の根本解決はどうするかなどを振り返ります。
振り返りの積み重ねによって、今後、判断がより迅速になってスムーズな解消につながります。
もちろん良い部分もあると思うので、それもチーム内で共有し今後も継続するようにしましょう。
最後に
簡単にではありますが、障害対応で意識していることをプロダクトマネージャー目線で説明してきました。
参考になれば幸いです。
この記事が気に入ったらサポートをしてみませんか?