見出し画像

Telegraf + InfluxDB + Grafana でネットワークを可視化してみた

小雨でも、ついうっかり走ってる、しょっさんです。おはようございます。

家庭内の Network Monitoring System(NMS) をどうするかで、ずっと考え込んでいましたが、Telegraf, InfluxDB, Grafana でほぼほぼ決定です。

結局、監視用のモニタツールなんてものは見栄えが良くなければ見もしないし、楽しくもないので Grafana 一択になりました。お金出せばもっとすごいのいろいろありますが、そのために毎年数十万とかは支払えません。ちょっとの苦労で、かっこいいグラフが出れば満足です。

ということで、アウトプットされるグラフはもうこれで確定。あとは snmpなど含めデータを収集してきて、保管するところです。Grafana 自体はいろいろなデータソースを標準で対応していますし、プラグインで追加も可能です。最初の頃は、昔を懐かしんで「ざびたん」こと Zabbix をいじったりもしてました。これなら agent タイプも snmp もどっちもいけますし。

 が、自動的に snmp 拾ってきてくれるのはありがたいのですが、Grafana で表示するときにたまに表示がコケたりしてリロードするのはいけ好きません。データの取得頻度が短いのもあんまり好きじゃないです。

こういうとき、素人にはド定番が最上です。余計なことを考えずに、人が強いたレールの上を歩くのがまず懸命です。

そこでグーグルさんに訪ねたら、ほぼほぼ Telegraf, InfluxDB, Grafana の構成です。情報もたくさんあるし、Debian/Ubuntu のリポジトリもあるし(Ubuntu 20.04のリポジトリもあるの偉い)。ということで善は急げ。嬉しいことに Edgerouter 用のテンプレート を公開してくれている人もいるので、そのまま利活用です。

そしたらこんなんですよ、こんなん。男の子(うちの嫁も)の大好きな画面が一瞬で構成できました(上下にスクロールするともっとたんまり出てくる)。

画像1

結果論的に行けばこれで確定です。

が、どーも InfluxDB におかしなところがあって、データの TAG 情報(ホスト名とか)を拾ってくるときの operand (= や !=) のうち "=" だけがまともに動きません。bug か? 他にも同じような人いますが、まともに解決している試しがない、結局バグっぽい。close してるのに直ってない。enbug?

仕方ないので、そのへんの式を、みんな大好き「ド・モルガンの法則」で書き直してあげて、グラフをちゃんと表示できるようにしました。アホらしい。まぁその御蔭で、初めての「時系列データベース(Time Series DataBase = TSDB)」をある程度理解できたので良かったです。TSDB といえば Prometheus も流行りっぽいので、そのうち手を出してみようかなとか。InfluxDB もそうだけど、最近は Go言語でできてるの多いね。

ということで、漢ならモニタリングだ。ということで、モニタリング用の新しいモニタをください。表示し続けたい。嗚呼、根っからのインフラ屋さんだな...。

貴方がサポートしてくれると、私が幸せ。 私が幸せになると、貴方も幸せ。 新しいガジェット・ソフトウェアのレビューに、貴方の力が必要です。