「入門 監視」を読んだ
「入門 監視」を読んだので特に印象に残った要点と感想を記録します。
1. 監視のアンチパターンについて
チームに何が必要かを考えてから要求に見合うツールを探す
例: 私たちのチームは「監視ツールのxxを取り入れる必要がある」ではなくて「△△のメトリクスを監視する必要があるから何を導入すれば良いか」を考える
監視は複雑な問題を一括りにしたもの→監視したい目的によって専用のツールが必要
監視を支えにしない
監視をしているからといって保守が難しいひどいコードを書かない
■感想
何か新しい仕組みを導入するときに「XXのツールを導入しないと」みたいな議論になりがちなので何が目的かは考えて実行した方が良いと思った
なんでもできるツールは存在しないので、解決したい問題・監視したい事象ごとに組み合わせて使いたい
どうせ監視しているからという理由で変なコードを書かないように気をつけたい
監視のデザインパターンについて
データ収集にはpush型とpull型がある、push型はスケールがしやすい
できるだけユーザーに近いところから監視をするべき
ユーザー目線でページが表示されるか(200が返却されるのか)など
常に改善し続けることが大事
■感想
push型がスケールしやすいのは納得
Webアプリケーションなどだと、結局ユーザー目線からシステムが動いているか、可用な状態かどうかが大事である
常に改善しつつづけたい
アラートの種類・インシデント管理について
アラートには3種類がある。「いますぐ対応が必要なのか」、「長期的な対応で問題ないのか」、「今後の記録のために保存しておくのか」
アラートの対応手順書を書くべき
チューニングし続ける
インシデント発生時の役割分担
Incident Commander: 意思決定をする
Scribe: 書記
Communication Liaison: 社内外でコミュニケーションをとる
Subject Matter Expert: 実際にインシデントの対応をする
■感想
アラートの種類ごとに通知の仕方は工夫したいなと思った
ビジネスを監視する
ビジネスモデルの記述からビジネスKPIを作成する。そしてビジネスKPIを技術指標を繋げる
■感想
スタートアップとかでもビジネスKPIをしっかりメトリクスで監視できたら良いなと思った。YelpやRedditでの企業事例でそれぞれのビジネスモデルにそったビジネスKPIが示されていてわかりやすかった
これからやりたいこと
監視ツールで定義しているダッシュボード・監視しているメトリクス・アラートの設定等常に改善する気持ちで取り組む
スタートアップでもビジネスメトリクスの計測などから監視を少しずつ始めていきたい
その時に何が目的なのか、どんなことが解決したい問題なのかを考えながら取り組みたい。