Telegraf + InfluxDB + Grafana でネットワークを可視化してみた
小雨でも、ついうっかり走ってる、しょっさんです。おはようございます。
家庭内の Network Monitoring System(NMS) をどうするかで、ずっと考え込んでいましたが、Telegraf, InfluxDB, Grafana でほぼほぼ決定です。
結局、監視用のモニタツールなんてものは見栄えが良くなければ見もしないし、楽しくもないので Grafana 一択になりました。お金出せばもっとすごいのいろいろありますが、そのために毎年数十万とかは支払えません。ちょっとの苦労で、かっこいいグラフが出れば満足です。
ということで、アウトプットされるグラフはもうこれで確定。あとは snmpなど含めデータを収集してきて、保管するところです。Grafana 自体はいろいろなデータソースを標準で対応していますし、プラグインで追加も可能です。最初の頃は、昔を懐かしんで「ざびたん」こと Zabbix をいじったりもしてました。これなら agent タイプも snmp もどっちもいけますし。
が、自動的に snmp 拾ってきてくれるのはありがたいのですが、Grafana で表示するときにたまに表示がコケたりしてリロードするのはいけ好きません。データの取得頻度が短いのもあんまり好きじゃないです。
こういうとき、素人にはド定番が最上です。余計なことを考えずに、人が強いたレールの上を歩くのがまず懸命です。
そこでグーグルさんに訪ねたら、ほぼほぼ Telegraf, InfluxDB, Grafana の構成です。情報もたくさんあるし、Debian/Ubuntu のリポジトリもあるし(Ubuntu 20.04のリポジトリもあるの偉い)。ということで善は急げ。嬉しいことに Edgerouter 用のテンプレート を公開してくれている人もいるので、そのまま利活用です。
そしたらこんなんですよ、こんなん。男の子(うちの嫁も)の大好きな画面が一瞬で構成できました(上下にスクロールするともっとたんまり出てくる)。
結果論的に行けばこれで確定です。
が、どーも InfluxDB におかしなところがあって、データの TAG 情報(ホスト名とか)を拾ってくるときの operand (= や !=) のうち "=" だけがまともに動きません。bug か? 他にも同じような人いますが、まともに解決している試しがない、結局バグっぽい。close してるのに直ってない。enbug?
仕方ないので、そのへんの式を、みんな大好き「ド・モルガンの法則」で書き直してあげて、グラフをちゃんと表示できるようにしました。アホらしい。まぁその御蔭で、初めての「時系列データベース(Time Series DataBase = TSDB)」をある程度理解できたので良かったです。TSDB といえば Prometheus も流行りっぽいので、そのうち手を出してみようかなとか。InfluxDB もそうだけど、最近は Go言語でできてるの多いね。
ということで、漢ならモニタリングだ。ということで、モニタリング用の新しいモニタをください。表示し続けたい。嗚呼、根っからのインフラ屋さんだな...。
貴方がサポートしてくれると、私が幸せ。 私が幸せになると、貴方も幸せ。 新しいガジェット・ソフトウェアのレビューに、貴方の力が必要です。