![見出し画像](https://assets.st-note.com/production/uploads/images/78917086/rectangle_large_type_2_88ed58ecf79d26096e69c096edd157e5.jpeg?width=1200)
ポストモーテム みずほ銀行システム障害 事後検証報告 でシステムとマネジメントについて学んだお話。
Q?:このポストモーテムから学ぶことは?
A?:貧弱な監視・運用体制で、複雑なシステムを運用していた。
ポストモーテム みずほ銀行システム障害 事後検証報告
日経コンピュータ
を読みました。
ポストモーテム(postmortem)と言う言葉を、初めて知りました。
ITの世界では、事後検証報告書と訳されているとのことです。
他にも、検死や死体解剖(司法解剖)といった意味もあるそうです。
発生した事象から教訓を得て、今後の取組みに活かすために使う。
と言うのが目的です。
さて、A?にあたる一文ですが、本書から引用します。
みずほ銀行が他行に比べて貧弱なシステム監視・運用体制で、他行に比べて複雑なシステムを運用していたのだけは間違いない。
なぜこの一文を選んだのかというと、
みずほ銀行単独や銀行業界、コンピュータ業界に限らず、
また、組織の大きさに関わらず、
汎用性のある一般的な教訓
だと考えたからです。
みずほ銀行だけで障害が続いた最も大きな要因であり、
みずほ銀行と言う企業風土を的確に表していることが、
理解できます。
どう言うことかというと、
他行や他国に比べて、責任者や対応者が不明瞭であり、
障害対応訓練、ダメージコントロールの体制が貧弱
であったことがわかります。
マルチベンダーであるため、
採用されているアーキテクチャが多種多様で
運用手順も多種多様になっており、
複雑性が高いと言えます。
マルチベンダー、多彩なアーキテクチャそのものが
直接の要因となったと言うわけではなく、
それらを運用する体制が整っていなかったと言うことです。
では、これらから得られる一般的な教訓とは?
「システム」は極力シンプルに
「マネジメント」は情報共有、対応訓練を密に
と言うことができると、私は考えています。
また、人間が判断することとシステムが判断することを
明確に線引きをしておくことも重要だと考えられます。
金融庁が「真因」と判断した4つの項目。
①システムに係るリスクと専門性の軽視
② IT 現場の実態軽視
③顧客影響に対する感度の欠如、営業現場の実態軽視
④言うべき事を言わない、言われたことだけしかしない姿勢
①〜③までが、全て「軽視」と言うのが興味深いです。
また、④は本書の別箇所で、
積極的に声を上げることでかえって責任問題となるリスクをとるよりも、自らの持ち場でやれることをやっていたといえるための行動をとる方が、組織内の行動として合理的な選択となってしまう。
と詳細に書かれていています。
私自身は、下記2冊を出版順に読んでいます。
併せて読むことで、みずほ銀行の歴史をより深く知ることができます。
言うべき事を言って、行動していきたい
そんな今日この頃。
![](https://assets.st-note.com/img/1653008128607-AmgjCy9eiy.jpg?width=1200)