AWSにおける形式手法 - 前書き(3/4) 並列分散処理は難しい
先週, 時間が取れず, 時間が空いてしまいました.
前書きの第3段落目を読んで, 私が理解できたことは次の通りです. 後半が少し怪しいですが, 大筋では間違ってないと思います.
S3はユーザが預けたデータを格納し処理する数あるAWSのサービスの一つに過ぎない. データを保護するために, これらサービスの核となる部分は, 耐障害性のある分散アルゴリズムに採用しており, レプリケーション, 一貫性, 同時実行制御, オートスケーリング, 負荷分散, その他協調して動作する処理を使っている. このように多くのアルゴリズムを使っているが, これらのアルゴリズムを一つのシステムに詰め込むことは難易度が高く, 運用しているシステムを間違いなく動作させるためには, 多くの場合, これらのアルゴリズムの修正が必要であった. 更に, 自分たちで必要なアルゴリズムを発明することもあった.私たちは不要な複雑さを取り除くためにかなり努力したが, 本質的な複雑さは残り続けた.
レプリケーションについて補足しておきます. レプリケーションとは, 複数のシステムで同じ処理を同時に実行し, 結果を共有することで, 信頼性や耐障害性を高めます.
何で読んだか忘れましたが, スペースシャトルでは同じシステムを3台積み込んでいたとか. 宇宙空間では, 放射線の影響によりメモリの内容が書き変わり, 処理を誤ることがあるそうです.