東証のシステムダウン 2020/10/01
東証のシステムが丸一日ダウンしたことを巡って。システムを提供している富士通が批判された。なぜ冗長性redundancyがかくも低いのかと。冗長性とは、システムの一部に異常が発生したとき、バックアップ装置に切り替わるなど、システムの安定性を支える様々な仕組みを指すとのこと(そして批判は、仕組みはあったがそれがうまく作動しなかったと)。批判が厳しいのは、東証のシステムダウンはこれが初めてではないこと。そして外から見ると、富士通は国産メーカーというだけで、東証のビジネスを長年続けてきた。にも拘わらず、このようなダウンをなぜ繰り返し起こすのかということ対して。
これに対してエンジニアの方を中心に、内外のシステムダウンの事例を引いて、こうした問題(機械の故障)はそもそも不可避、避けがたいと弁護する意見がある。しかし弁護する意見も、冗長性の低さという指摘には、押し黙らざるを得ないようだ。
東証は記者会見を開いて、共有装置内のメモリーディスクの故障が発端だとした(すでに注文を受け付けている時間なので、手動でディスクを交換しての再開はあきらめた)。で交換して明日再開しますと。一見、一件落着に見える。
しかし多くの人は、問題が相場情報システムでも生じたとの報道に注目して、別の批判ターゲットを探そうとした。確かにハードは富士通なのだが、ここは米国ベンチャーNutanixの技術を採用したのではなかったか?と(ダイヤモンド2017/09/12の報道記事による 詳細は 東証インフラ基盤刷新 2017/08/31) Nutanixはweb scale ITの担い手として知られている米国ベンチャー。そこでNutanixにも問題があったのでは?と憶測が生まれた。
what is webscale IT? youtube2015/11/25
今回のダウンについては、幾つか疑問が残る。エンジニアの方たちがいうように故障とはありふれたことだという言い方が、社会的な基幹システムでもそもそも許されるのだろうか?そうした問題を解決し、冗長性を実現するのがエニジニアの役割ではないのだろうか(たとえばバックアップへの切り替えが円滑にゆくかを、日常的に確認して突発的なダウンのリスクを減らす努力をすることはそもそもできないものなのだろうか。あるいはそれをしていたけれど今回の問題は生じたのだろうか)?また相場情報システム側で生じた問題の内容は、今のところ詳報されていないが何をさすのだろうか?