見出し画像

最近よく聞く「オブザーバビリティ」って何だ : INSTANAは優れものか

アプリケーション基盤としてクラウドを利用することが一般化するにつれて、運用の世界でオブザーバビリティという単語を耳にした人も多いと思います。自身もこの概念が意味するもの、その重要性をきちんと理解していなかったので、まとめてみることにしました。

Observability = Observe + ability

英語表記では Observability であり、観察する Observe と能力の ability の組み合わせだと容易に気づきますし、翻訳は「可観測性」ですね。「観察する能力」という表現なので、モニタリングとは違うの、という質問が必ず出てきます。モニタリングは監視と表現されるのですが、こちらは、現在起きている事象を見続けるという意味合いであり、事前に定義された異常が起きたときに単に通知するだけですが、これに対してオブザーバビリティは、過去の事象と異なる、または予期せぬことが起きたときに、それに至った原因を把握することまでが含まれています。

モニタリングは、オブザーバビリティの大事な要素で、まずは設定された間隔で特定のメトリックスを記録して何が起きているのかを検知する。そして次は根本原因を探るための調査ですが、これはどのイベントで問題が発生しているのかを複数のシステム/アプリケーションにまたがって関連性を明らかにしつつ、各種ログから原因を明らかにしていく。

となると、オブザーバビリティのツールは、インシデント発生時にいかに早期に正確に事実を把握することができて、それにより手を打つことができるかが勝負となりそうです。そしてここにもAI技術がということで、すでに人間の手では認識できないようなパターンや相関関係を見出してくれることが期待されています。

昨年IBMは、シカゴに本社を置き、ドイツに開発センターを持つアプリケーション・パフォーマンス・モニタリング企業「INSTANA」を統合しています。この製品について、他ツールと比較して特に優れている点を中心に、少し触れてみようと思います。

まず管理対象にエージェントを導入することで、サーバー上のソフトウェアを自動検出し性能情報の収集を開始します。もし構成が変更された場合でも設定変更作業をすることなく自動的に変更され、その際にサーバやエージェントの停止や再起動を必要としません。利用者はエージェントを導入してから情報収集を開始するまで、ほとんどの処理が自動化されています

データの取得粒度については、以前のツールでは10秒に一回程度でしたが、Instanaの場合には非サンプリングで1秒に一回収集されるので、アプリケーションを介したすべての要求をトレースで正確にキャプチャします。

問題が与える可能性がある影響範囲の特定は非常に重要ですが、Instanaでは、センサーにより収集したすべてのリクエストを解析し、各サービスの依存関係を把握。コンポーネント、サービス、リクエストを論理的にグループ化して、気になるサービスを簡単に可視化します

従来型のモニタリングでは、気になるアクセスログやシステムリソース利用量などに個別のしきい値を設けてアラート設定するのが一般的ですが、やみくもに行うことにより、場合によってはアラートが大量に発報されて、何が重要なのかがわからない事態になります。Instanaでは、AIも活用して、あらゆるリクエストやシステムの振る舞いを分析してエラーの検出や、ボトルネックを自動で発見し、エラーからブレイクダウンして詳細を確認できます

どうですか。Instanaの優れた点をちょっとコメントしてみましたが、デモサイトも用意されているようなので、気になる方は、下記にアクセスしてみてください。


いいなと思ったら応援しよう!