見出し画像

災害時にサービスはどうなる?

こんにちは、ファーストアカウンティング note編集チームのTamです。

2024年も残すところあと2か月と少し。振り返ると今年は震災に始まり、豪雨や台風、「南海トラフ地震臨時情報」なんてものも出たりして、災害への危機感がつのるような出来事が多かったですね。
そこでふと疑問。ファーストアカウンティングのサービスは災害時にはどうなるのでしょう?

というわけで、開発部門のUさんに突撃インタビューしてみました。

Uさん、弊社では何か災害対策などの取り組みをしているのでしょうか?

「そうですね。東京はいずれ大震災などの災害が起こると言われていますが、そうでなくても災害が発生する可能性は常にあるので、ディザスタリカバリという、災害によってシステムの継続利用が不可能になった場合の復旧および修復の仕組みを構築しています。そして、実際に災害が発生した際にスムーズに移行できるよう、私たちのチームで訓練を行っています。いわゆる、サーバ上の避難訓練みたいなものです」

そんな準備があるのですね。

「ファーストアカウンティングでは、Peppolネットワークに接続するためのアクセスポイントを提供していますよね。これは電子的にドキュメントを送受信するためのネットワークで、日本では特に電子インボイスを送受信するのに使われていることが多く、非常に公共性の高いサービスになります。だから、Peppolのアクセスポイントはダウンタイムを毎月何時間以下に収めなければいけないというようなルールが決められているんです」

その可用性を確保するために、どのようなことをしているのでしょう?

「ファーストアカウンティングのアクセスポイントは通常、東京リージョンのデータセンターを使ってサービスの提供をしているのですが、実はその裏で、他のリージョンでもサービスが提供できるような状態になっています。地方からリモートで勤務しているチームメンバーにそのリージョン切り替えの作業を実際にやってもらうための練習というか、いわゆる訓練みたいなものを行っています。半年に1回ほど、定期的に取り組んでいます」

たしかに避難訓練のようですね。具体的にはどういう作業になるんですか?

「訓練自体は本番のサービスを提供している環境ではなくて検証環境でやっています。普段、東京と大阪でサービスがどちらも起動していますが、実際に呼び出されるサービスが動いているのは東京で、大阪は待機系になっています。大阪にはデータベースがコピーされたものがあって、サービスが動いているけれど呼び出されない状態になっているということです。なので、この大阪のほうをコピーとしてではなく、本番のデータベースとして使うようにするんです。マスターとリーダーの切り替えと言うんですが、逆に東京のほうがコピーになるようにします。同じように呼び出されるサービスも大阪のものに切り替えます。このように役割の交換をすることで、東京から大阪に切り替えるというわけです」

実施時の様子

では、もし東京で何か大災害があった時でも、Peppolのアクセスポイントは動き続けるのですね。

「そうですね。数分程度で切り替えができるということは確認しているので、実際にそれほど長いダウンタイムはないかなと思います」

ファーストアカウンティングの他のサービスでも、そのような対策はやっているのでしょうか?

「Peppolアクセスポイントはインフラであり、ダウンすることによる社会的な影響もかなり大きいので、よりプライオリティを上げて取り組んでいるわけですが、もちろんRobotaやRemotaのサービスでも、災害時の即時の別リージョン切り替えを社内で検討しています。ただ、一種類だけなら数分程度で切り替えられますが、すべてのサービスを切り替えなければいけないとなると、やはり時間がかかります。なので、その手順を簡単にするとか、もっと自動でできる部分は自動化するとか、そういうようなことを今は開発チーム全体で考えているところです」

訓練後には改善点を話し合い、今後の予定も立てていきます

よりたくさんのサービスでこのような取り組みを進め、さらに簡単に切り替えができるような仕組みに改善していくわけですね。
いざというときも安心して使えるようにと開発の皆さんが頑張っている様子がよくわかりました!
Uさん、貴重なお時間をありがとうございました!


いいなと思ったら応援しよう!