見出し画像

【資料付き】どうしてAPMが効果的なの?運用者も納得の対応フローの変化

今日の仕事はなんでしょう?

「アクセスログの確認」
「問い合わせされた問題の分析」
「負荷チェックや性能チェック」

運用者は細かな仕事が多いですよね。

システム、アプリケーションが順当に動くために大切ですが、日々のチェックは大変です。

問題分析ひとつとっても性能の問題か、アプリケーションの仕様なのか切り分けないといけません。

今回の記事では、下記の2点をお伝えします。

  1. 運用者を助けるAPM製品、IBM Instana Observabilityでは障害対応のフローはどう変化するのか。

  2. 本記事で案内する第2回の資料のポイント。


前回の資料付き記事をご覧になりたい方は、こちらからどうぞ!

https://note.com/ibmj_csm/n/naae77c590ff1


本記事では資料が添付されます。あわせてご覧ください。


本記事での資料

運用者が見るべき、ダッシュボードと問題の把握
- 基本の見方を理解する -

リンクはこちらから。


ではさっそく記事に入りましょう!
この記事は、3分で読めます。

APMのダッシュボードによって、日々の運用は変わる

年を経るごとに、システムは複雑化していき、監視対象も増えてきました。

現在の運用・監視はどのようになっていますか?
誰が見ても同じ精度でチェックできているでしょうか?

属人化といった問題に発展しがちな運用についてAPMを挟んで考えてみましょう。

必要な情報まとめて見ることが出来る

監視体制はログを見るだけ、ということはないでしょう。

日々の負荷情報や予想されるアクセス数、使用しているメモリなど、多くの情報から、最適な環境改善も提案しなければなりません。

そのためには、必要な情報をダッシュボードに集めておくことが大事です。APMではダッシュボードのカスタマイズによって、見るべき情報を集めておくことが可能です。

ここで改めてObservabilityの意味を確認しましょう

Observabilityとは可観測性のことです。IBMのAPM製品である、IBM Instana Observabilityになぜこの単語がついているのか、という点を知っていただければと思っています。

APMとObservabilityは同じものと解釈されているかも知れません。APMの意味はアプリケーションパフォーマンス管理です。管理するためには、監視が必要となるため、同じように感じるのかも知れませんね。

さらに細かく、いつでも監視できる状態を維持することを目的としている、と捉えてもらうのがよいでしょう。

参考:https://www.ibm.com/jp-ja/topics/observability

APMの自然な進化がObservability。IBM Instana Observabilityです。

可観測性を高め、1秒単位の細粒度でトレースを行う、リアルタイム監視を実現したものが、Instanaの特徴です。

私たち運用者は、できる限りアプリケーション・インフラに問題が発生しないように、可用性を高めていく必要があります。

APMとObservabilityの合わさったものが、監視の精度を高め、属人化を避けることを可能にするでしょう。日々の運用をより安定に、安全に、誰にもできるように、これからも進化していくことが期待されていくのです。

本記事のAPM資料の案内

今回の資料は、運用者の混乱を増長させる見る項目の多さを「どう解決するのか」案内しています。

障害発生時に、私たち運用者は多くの情報に触れることになります。ログやアラート、本番環境でのコンソール操作、緊張感もひとしおですよね。

APMではどのようにシンプルに解決してくれるのでしょうか?

インシデントは分析されている

「アラートメール(あるいは通知)が届きました」
「じゃあ調査開始」

という時代は変わってきています。インシデントの通知が来ている段階で、すでにそのインシデントがどのようなものか、どこで発生しているのか、分析されています。

ひとえに、機械学習とこれまでのデータの蓄積にあります。また、可観測性の高まりによって、多くのエンドポイントの監視が可能になったことが挙げられるでしょう。

資料では、インシデント発生からその情報の閲覧の流れまでを紹介しています。

問題につながるデータが簡単に参照できる

分析されているということは、なぜインシデントが起きたのかを示すデータも揃っているということです。そのデータを1から集める必要はなく、起きた状況に対する問題箇所のデータは参照が可能です。

優先度に合わせ、問題解決が急務の場合にはインシデント情報がまとまっている画面から、原因特定まで辿り着くことができることがわかるでしょう。

ダッシュボードをどう見るのか、学ぶだけで運用は楽になる

製品が複雑だと、どうしても学習コストが上がってしまいます。しかしInstanaでは、ダッシュボードをどう見るのか、インシデントが発生した時の流れを一度学習するだけで、容易に理解できるようになっています。

わかりやすさ、シンプルさ、そして1秒単位のリアルタイム監視が運用をより楽にしてくれることでしょう。

今後の資料では、アラートの設定なども取り上げていきます。まずは基本を押さえつつ、細かな部分を捕捉的に理解していただければ幸いです。

第3回の〆:変化が余裕を生み出し、手の届かなかった部分に手を回せる

Instanaの活用によって、手一杯だった運用に変化が生まれたらどうなるでしょうか?効率化というのは単純な自動化だけではなく、余裕を生み出すものです。

前回の記事では通知設定の動画について紹介しました。今後もAPMについて、Instanaについてわかりやすく、さらに視覚的にも解説していきます。


動画についてはこちらから。

https://note.com/ibmj_csm/n/nfb3d4b10b358


日々の運用に余裕が生まれれば、いままで手が出なかった部分の改善にも着手することができます。長期的に見れば、運用の効率化はさらなる余裕を生み出し、より良いアプリケーションの提供、さらにはエンドユーザーとの信頼関係の構築につながるでしょう。

私たちはその一助になれば思い、今後もInstanaを活用していただくためにCSM活動を継続してまいります。

次回もよろしくお願いいたします!


冒頭にも記載しましたが、今回の資料は下記より閲覧可能です。


運用者が見るべき、ダッシュボードと問題の把握
- 基本の見方を理解する -

リンクはこちらから。



フォローしていただくと、新着記事が出た際に分かりますのでご活用ください。スキやコメント、資料についてなどご意見お待ちしております。
閲覧ありがとうございます!



執筆

日本アイ・ビー・エム株式会社
テクノロジー事業本部
カスタマーサクセスマネージャー

小石川 将晃

いいなと思ったら応援しよう!