テレビ朝日が中性子の攻撃を受けた話
2024年7月にテレビ朝日の番組送出設備にあるネットワークに障害が発生しCMが流れなかったり番組そのものが送出できなかったという放送事故が起こりました。先日障害の原因についてのプレスリリースが出されましたがその内容として
「中性子線の影響が原因である」
となっていてこの発表に驚いた方もかなりいらっしゃるのではないでしょうか?
局内で核分裂が起こるような原爆の爆発や原子炉事故があったわけでもありません。なんだかSFチックでミステリアスな感じがしますが調べてみるとなかなか厄介な事故であることがわかってきます。
放送事故の概要
7月23日の午後10過ぎから約2時間の間、局内にあるマスター設備内にあるネットワークスイッチに障害が発生して地上波放送はCM送出はが不可能に、BS放送は番組・CMともに送出することが出来ませんでした。
マスター設備とは放送される最終形のコンテンツを扱う設備でここから送信所に送って視聴者に番組が放送されます。この設備自体に障害はなかったのですが途中経路にあるネットワークスイッチに障害が起こったため適切な指令が伝えられず放送事故に繋がったいうことです。この事故によりCMスポンサーに支払う補償額は数億円に上るとの見解もあります。この事故の原因が目に見えない中性子線であると報告されたわけです。
中性子線はどこからやってきたのか?
先に答えをいうと空から降ってきます。宇宙空間には宇宙線という高エネルギーの放射線が飛び交っていて地球の大気にぶつかると核反応を引き起こして中性子線が出てきます。これが半導体にぶつかると様々な不具合が出るということが既にわかっていて稀な現象ではあるのですがシステム的に大きな障害となるケースがあります。
中性子線が原因としてよく取り上げられるケース
サンマイクロシステムズのサーバー不具合
中性子線に比較的弱いとされるメモリ(SRAM)を使ったばっかりに出荷した製品に不具合続出。会社経営が傾きかけた例。
カンタス航空72便急降下事故
機体を制御するコンピューターに不可解なデータが送られたため誤動作を起こし機体が急降下。乗員乗客合わせて12人が骨折や脊髄損傷などの重症者が出た例。
空からやってくる目に見えないものが人の活動にクリティカルな影響を与えるということが現実に起こっているわけです。
中性子線が半導体にどういう影響を与えるのか?
中性子線は半導体に対してソフトエラーというものを引き起こします。ソフトエラーはソフトウェア(アプリとか)のバグというものではなくてハードエラーに対する用語になります。
ハードエラー 回路が焼き切れたとか破損して交換以外手立てがないエラー
ソフトエラー データの一部取り違えで一時的な誤動作を引き起こすエラー
ハードエラーはイメージしやすいと思います。本当に半導体がぶっ壊れたということです。対してソフトエラーはハードウェア的な故障でも何でもなく何らかの原因でチップ内部にあるデータがたまたま変わってしまいそれが普段と違う動作(誤作動)を引き起こすというものです。システムを再起動すれば何事もなかったかの如く普通に動作します。今回そのデータを書き換えた犯人が中性子線ということになります。
コンピュータは0と1で動いているということは皆さんご存じのことかと思います。その0と1 を保存しているメモリと呼ばれるあたりに中性子が当たるとこれが起点となり0と1が入れ替わる現象が起きることがあります。これをSEU(シングルイベントアップセット)といいます。そんな0と1が一つ入れ替わっただけで誤作動になるのか?と思う方もいらっしゃると思いますが まぁなるでしょうね、、
ソフトエラーでどんなことが起きるのか?
テレビ朝日のプレスリリースにはメモリエラーとしか書いていないので推測になってしまいますがメインのメモリはエラー訂正機能がありますしデータの内容によっては多少間違っても問題なしの場合があります。ただしコンピュータの中心部に近いレジスタやキャッシュメモリにSEUが起きるとヤバい状態になりがちです。
40年前にパソコン少年だった人で(少年でなくてもいいのですが)マシン語というプログラミング言語を使ってたならそのヤバさは100%誰もが知っています。
コンピュータが暴走するのです。
当時の原始的なパソコンではマシン語を使って0と1で直接コンピュータを人間が操作するという今にしてみればとんでもないことをしていたのですが0と1が違うだけで全く別な命令となり、ユーザーが意図しない動作=暴走になることがよくありました。(熱暴走とはまた違う現象になります)
暴走した時の例
・まずキーボードなど入力は受け付けない
・画面がグチャグチャになる(サイケな画像になることが多い)
・スピーカーから奇怪な音が鳴り響く
・何時間もかけて打ち込んだプログラムの破壊・消去
・勝手にリセット
など様々な現象が起きます。これは故障でも何でもなく0と1が間違っていたのが原因です。操作したコンピュータの中心部のチップ(CPUといいます)はその通り動いただけなのですがユーザーの意図とかけ離れた動作となっただけです。ソフトエラーと同じく再起動すれば何事もなかったように立ち上がります。
またネットワークスイッチにはFPGAという内部の電子回路構成を後から書換え可能なデバイスが使われることが多くこれもSEUが起きる場合があります。
0,1が変わるということは電子回路そのものが変わってしまうため期待通りの動作はしなくなってしまいます。
テレビ朝日の報告書ではネットワークスイッチが誤作動で大量のデータが流れたとあります。その誤作動は暴走でそのきっかけとなる0, 1を変化させたのが中性子線ということになりそうです。
厄介な中性子の能力
さっきから中性子について断定した書き方はしていなくモヤモヤしている方もいるかもしれません。これには中性子線の性質によるものです。
・中性子線の平均寿命は15分
・半導体にぶつかって問題を起こした瞬間もうそこにはいない
・現場に証拠を一切残さない
・問題の再現性はゼロ
暗殺者ならゴルゴ13を軽く超える能力の持ち主です。犯人は推定できるのに捕まえられない完全犯罪となります。
冒頭に挙げた中性子線による被害のケースも結局は中性子線のせいだと断定するまでには至りませんでした。
サンマイクロシステムズのサーバー不具合
近視眼的に性能を上げるためによく検証されていない部品を使ったことが原因。ソフトエラーだとわかったのは後のこと。顧客対応もまずかった。サンマイクロシステムズは2010年にオラクル社に吸収されて消滅する。
カンタス航空72便急降下事故
もともと機体には(エアバスA330)を制御するコンピューターはバックアップ含めて3基搭載されており、不可解なデータが送られたにせよその3基がうまく同調して問題に対処できなかったことの方が問題じゃねーかとそっちの方を改修して解決させました。中性子線は結局はありそうにないレベルとして片付けられました。
テレビ朝日もいろんな原因となる仮定を考えては一つ一つ検証していったのだと思います。全ての仮定が否定された後に中性子線による影響しかなさそうという結論に至ったものと想像します。
当たりどころが悪かった
という他ありません。
ソフトエラーを防ぐ手立てはあるのか
宇宙船や人工衛星など鼻っから高エネルギー粒子がガンガン飛び交っていくところは対策がとられていますし地上でのソフトエラーが知られるようになってからはソフトエラーに強い、もしくはソフトエラーしにくい半導体研究が進んでいます。自動運転技術など誤動作が起きた時の影響が大きいのものは規格が制定されていますし新たな国際基準の作成も行われていて民間だけでなく経済産業省や総務省などの機関も支援してこの問題にあたっています。
とはいえハードウェアの方での対処はコストがかかり一般のシステムまで浸透するにはまだ時間がかかりそうです。そうなると運用方法を含めたシステム構築が鍵となってきます。
テレビ朝日での放送事故はネットワークスイッチの誤動作によるものです。バックアップとなる機器や代替のネットワークを用意するのは当然ですが障害が発生した時間帯的に的確な判断を下せる技術者や承認権限を持つ人物がいるとも限りません。リモートで機器の状態を探ることは今回は難しかったと思われます。
事前に現場の人間でも対応できるようなチェックリストを作って置きとりあえずの対処にあたらせます。それがうまくいかなかったとしてもその情報から故障箇所のヒントが出てくるはずです。原因箇所を特定できれば最善の処置が可能になります。
障害が起こってしまったことについては仕方ないにしろ障害によるダウンタイムを減らすことはできます。
問題の対処はこれでよかったのか
放送事故なので始末書?書いてお上(総務省)に報告する必要があります。原因がわかりませんとか当たりどころが悪かったと書くわけにもいかず、もっともらしい報告書に仕立て上げなくてはなりません。総務省は中性子線の影響でシステムダウンすることは知っていて過去に某通信会社で中性子線による障害が起こったという報告を受け取っています。
気になったのは社内での処分です。
技術局担当取締役が役員報酬10%の自主返納、技術局長をけん責処分とあります。
責任を取った人物に役員がいるとはいえ技術だけの問題かという疑問が残ります。
・基本的に空から降ってくる中性子線を防ぐ手立てはない
・2025年に極大期を迎える太陽フレアによる宇宙線の増大
・半導体の微細化によるソフトエラーの増大
・放送システムはIPネットワークによる構築が進んでいる
ということがわかっていますので広範囲にわたって影響が出ることが想像できます。止めてはならない業務であれば経営全体で考える必要があるのではないでしょうか?
中性子線は上空に行くほど多くなります。飛行機に乗っていてスマホやタブレットがフリーズしたらそれは中性子線のせいかもしれません。その時には当たってラッキーと思って機器を再起動してみてください。
[参考] マスター障害 原因と再発防止策について テレビ朝日広報部