AUようやく復旧しましたね〜♬
個人的には通信インフラの重要性を改めて感じた次第…
大規模システムの設計・構築への視座
大規模なシステム障害を俯瞰すると、今回はコアルーターということだけど、一つ重要なところを僕らに示唆しているのではないかと思います。
つまりはシステム構築を考える上で、冗長系は欠かさないんですよね。
例えばサーバーも冗長系を組むし、サーバー事態もRAID化されているし、ある意味、単体機器が壊れても、少なくとも予備系は機能するように出来ている。今回も冗長系は構築されていましたね。
でも、それらをつなぐネットワーク機材ってSWやルーター含め、それらの制御だけで処理している気がしますね。
同じように、昔、航空券の発行や予約でシステムが止まった某航空会社の事象も、原因はネットワークSWだったような記憶があって、サーバー系は冗長化されていたけど、それらをつなぐネットワーク機器の故障で、結果的に冗長系を含めたシステム全体が機能しなくなるという点では同じような印象を持ちました…
多分、これらのシステム障害を経て、考えるべきは、データや信号が入ってくる段階からの完全なシステム冗長系(二重化)にしないと、防げないのではないかという点かと…
検証システムについて
実はわたしの本業でも、大きなシステムを複数持っていて、それらを安定的に運用するよう日頃から対応していますが、実際にインシデント等が起きると、想定外の場合は、それでもアタフタしてしまうときがあります。
システム全体を、完全なシステム冗長系にすると、つまりは本番系と同じシステムを2つ整備することになり、コストが高くなり、昨今のコスト削減と見合わない投資であると一蹴されることがある組織は多いですね…
なので検証システムも小規模で、基本機能の確認ができる程度のもので
済ましているところも多く、その検証系で作業工程を吟味し、実際の工程を確定していくわけだけど、やはり実際とは違うこともしばしばあったりします…
そのため、最近は完全なシステム冗長系としての検証系を用意して、本番系が駄目な時は、一旦この冗長系に全てを乗り移らせることをやってます。
つまりはBCPも兼ねて、扱う容量は本番系より少ないけれど、ほぼ本番系と同じもので構成されて支障なく本番系と同等に機能する検証系があるというもので、本番系が異常の際は完全にこの検証系を予備としたシステムに乗り代わる方法を最近は採用しています。
検証系は容量が小さいだけなので、最低限のサービスの維持が可能です。
全てのシステムが、この検証系に乗り代わっている間、本番系システムを完全に止められるので、システム再立ち上げや、故障の原因追求、対処などを進めて、回復したら、また検証系から本番系に乗り換えるという方法を採用しています。
サービスを止めないって重要なことで、それと設備投資コストをどう考えるかで、システムそのものの機器構成や構想もかなり違ってきますね~♬
まあ、インシデント対策の訓練などをしても、訓練で対処したようなインシデントとは性質が異なるものが実際に発生したりするので、なかなか人の技量も含め対策は難しいですね♬
KDDI社長の会見について
今回の社長会見を聞いて、個人的には非常にわかりやすく、また記者からの受け答えにも真摯に対応されていた印象を受けました。下手に技術音痴の社長が出てきて、説明は全て担当役員任せというわけでなく、きちんと現象や対処法を社長が理解し、説明できるって良いことだと思います。(以前のなんとかPAY関連での、セブンイレブンの二重認証を知らない社長会見とは大違いでした。)
会見に出てきた社長さんは、横国大の金属工学出身のようですが、工学系という点で、電子通信やデータ通信系も理解を示されているように思いました。
まあ、記者の質問は大手メディアほど情けなく、やっぱりそろそろメディアの記者にも専門能力というものがないと、あまりに頓珍漢で理解も出来なそうな様子がもろにわかりますね~♬
そのような記者が読者に理解できる記事を書けるのだろうかと、はなはだ疑問ですが、その辺のところが視聴者や読者に察知されているのは、プロとして情けない職業と思われているのでは…
会見が行われていた時間は、まだ全面復旧していない中で、社長に対し金銭保証の質問をしたところで、あまり明確な答えは、そもそも最初から期待できないですよね~♬ それを知っていて、そんな質問をする記者って、時間の無駄な気がするのはわたしだけなんだろうか…
さて、この会見は11時に始まって、全ての質問に真摯に応じて13時5分に終了。全てに真摯に応える姿勢っていうのは大切で、会見も罵声が飛び交うわけでなく、淡々と進んだことは、KDDIのリスク管理対応としての会見対応は良かったと評価できると思います。
その点で、例えば日大の危険タックルに関連したアメフト監督の会見とは大違いでしたね。マスコミ出身の仕切りたがり司会者が、喧嘩腰に会見をまとめようとする見苦しい内容だったことに比較すると、誠実さや丁寧に説明していくKDDI側の姿勢というものは立派だったといえます。
最後に
KDDIも、以前のNTTの事例を対岸の火事とせず、それを心得てVoLTEの交換作業を進めていた経緯はあるものの、今回の事象を発生させてしまった…
今後、このKDDIの事象を対岸の火事とせず、通信キャリアの業界や、情報システム系を持つ企業なども、自社では発生しないのか、同じ要件が仮に発生したら、どのように対処すべきかをシミュレーションしてもらいたいですね…
この件に限らず、業界他社の事件を「ざまあみろ」的に感じ、自社では発生しないとたかをくくって対処していないような組織は、データ不正で立て続けに同様の不祥事が見つかっていったように、いずれ同様の事件に頭を痛めることだろう…
そんなことを感じた、今回の会見でした。
この記事が気に入ったらサポートをしてみませんか?