見出し画像

CloudWatch&Zabbixでサーバ監視!アラート設定をガッツリ体験

はじめに

「AWSのCloudWatchでメトリクスは見てるけど、アラートはどう飛ばせばいいの?」
「Zabbixは名前は聞くけど、具体的にどう導入すればいいかわからない…」

サーバを運用するなら、監視とアラートは不可欠。特にCloudWatchZabbixは現場でもよく使われる強力ツールです。
本記事では、CloudWatch & Zabbixでサーバ監視を行う流れを紹介しながら、CPU使用率が高くなったらメール通知など、アラート設定の具体例を解説。未経験エンジニアでも、これを読めば「監視って意外にやれそう!」と思えるはずです。


1. なぜCloudWatchとZabbixを併用するケースがある?

  • CloudWatch

    • AWSの標準監視 → EC2, RDS, ELBなどAWSリソースにメトリクスが自動取得される

    • サーバレス(Lambda)やS3などAWS特有のサービスも監視対象にしやすい

  • Zabbix

    • 自分でインストールし、AWS以外のオンプレサーバや他クラウド含む統合監視が可能

    • カスタムトリガーや独自テンプレートが豊富

併用理由

  • AWSリソースはCloudWatchで、そのほかオンプレやマルチクラウドサーバはZabbixで監視

  • 企業内でZabbixが既に構築されている → 追加でAWSクラウドメトリクスをZabbixに取り込み or CloudWatchと連携


2. CloudWatchでの基本メトリクス&アラーム設定

1) メトリクスの確認

  • EC2:CPUUtilization, NetworkIn, DiskReadOps など

  • RDS:CPUUtilization, FreeStorageSpace, DatabaseConnections 等

  • CloudWatchコンソール → Metrics → サービスを選択 → グラフを表示

2) アラーム設定手順

  1. CloudWatch → Alarms → Create alarm

  2. メトリクス選択 (例:EC2のCPUUtilization)

  3. 閾値設定 (例:80%を超えたらアラート)

  4. SNSトピックを設定 → EmailやLambda、Slack連携を行う

メリット: AWS内のリソースなら初期設定不要 → ほぼ自動でメトリクスが取得され、GUIで簡単にアラームが作れる


3. Zabbix導入:サーバインストールと簡単なトリガー設定

1) Zabbixのサーバ構築 (Linuxで例)

  1. ダウンロード&インストール (Yum or aptリポジトリ)

    • sudo yum install zabbix-server-mysql zabbix-web-mysql zabbix-agent

  2. データベース設定 (MySQLなど)

  3. zabbix_server.conf のDB接続情報を編集

  4. Apache + PHP設定 → ZabbixウェブUIをブラウザで開く

  5. 初期設定ウィザードで完了

2) ホスト追加

  • Hosts」→「Create host」→ サーバIPやポートを登録

  • Zabbix Agentをインストール or “Agentless”方式も可

3) トリガー設定 (例:CPU負荷が80%超えでアラート)

  • Configuration → Hosts → Items/Triggers

  • ItemでCPU使用率を取得 → Triggerで「{CPU.usage.last()} > 80」でアラート

  • Actions でメールやSlack通知も設定


4. メールやSlack通知を連携する方法

  1. CloudWatch + SNS → Email

    • アラーム作成時にSNSトピックを設定 → “Email”プロトコルで受信アドレスを登録

    • 発報時、メールが届く

  2. CloudWatch + Slack

    • SNS→ Lambda→ Slack Webhook などで通知する

    • “AWS Chatbot”を使ってSlackチャンネルに通知も可

  3. Zabbix + SMTP or Webhook

    • Zabbix Server設定→ “Media Types” でEmail or Slackなど追加

    • Slackの場合、Webhook URLを入れて通知メッセージを定義

ポイント:

  • どんな内容を通知するか → 「どのホストのどのメトリクスが、どんな値で閾値超えたのか」をメッセージに入れる

  • テスト通知で実際の挙動を確認しよう


5. よくあるトラブル&対処法

  1. 監視対象の時間ズレ

    • CloudWatchの時刻設定 or サーバのタイムゾーンが異なる場合、データにズレが生じる

    • → ntp or chronyで時刻同期

  2. Zabbixエージェントがオフライン

    • ポート(10050/10051)がファイアウォールでブロック → 開放設定必須

    • エージェント設定ファイルにサーバIPを正しく指定

  3. アラートが通知されない

    • SNSやWebhookのURL/認証が間違っている

    • ZabbixならAction条件が間違い、またはトリガー閾値がゆるすぎる

  4. コスト注意(CloudWatch)

    • 大量のメトリクスやカスタムログ収集→ 月額費用がかさむ → 不要なメトリクスを削除


6. xCampで監視&運用ノウハウを学んで転職に活かそう

xCampAWSやLinuxの基礎を無料で学べるスクール。監視ツールや運用周りの実務的ノウハウにも詳しいメンターがサポートしてくれます。

  • CloudWatchのアラーム設定で詰まっても即相談 → 設定漏れやSNS設定の迷子を防ぎやすい

  • Zabbix導入の実験をメンターがフォロー → Install時のDB設定など初心者がハマるポイントを一緒に解決

  • 転職サポート: 監視系スキルは運用保守やSREなど幅広い求人に強み → 就職に有利

運用・保守ポジションへの転職や、インフラエンジニアのキャリアアップを狙う方にとって、監視スキルは非常に評価されるので、ぜひxCampで磨きましょう。


7. まとめ

サーバ監視とアラート設定は、運用の安定に直結する必須スキル。

  • CloudWatch → AWSサービスのデフォルト監視、簡単にアラートが作れる

  • Zabbix → オンプレや複数クラウド、幅広い環境に対応できる統合監視

両者を使い分け or 併用すれば、マルチクラウドやハイブリッド環境もカバー。通知連携(Email, Slackなど)を入れれば、問題発生時に素早く気付けます。

xCamp監視&運用ノウハウを学び、エンジニアとして安定稼働を支える力をアピールすれば、転職成功に大きく近づくでしょう。
この機会にぜひ、CloudWatch&Zabbixのハンズオンを試してみてください!


公式Xアカウント: _Xcamp_
弊社所属エンジニア(優太さん): @310engineer
弊社所属エンジニア(れおくん): @Reo_engineer_

いいなと思ったら応援しよう!