[系统集成] 基于telegraf, influxdb, grafana 建立 esxi 监控

之前在 nagios 上建立了 esxi 监控,指标少、配置麻烦、视觉效果差。最近我把 esxi 监控迁移到了 influxdb+grafana 平台上,无论是监控指标、可操作性还是视觉效果都有了很大提升。下面概括一下我的配置过程:

一、安装 influxdb 和 grafana

具体请参考 influxdb 和 grafana 的文档。

安装后在 influxdb 中创建新数据库,可以命名为:vsphere,然后将该数据库加入到 grafana数据源中。

[系统集成] 基于telegraf, influxdb, grafana 建立 esxi 监控

[系统集成] 基于telegraf, influxdb, grafana 建立 esxi 监控

二、安装 telegraf:1.3.4-vsphere2

有一位开源开发者 fork 了 telegraf_v1.3.4,加入了 esxi 监控插件,使用这个版本,可以很方便的获取 esxi 监控数据,包括 host信息,vm信息,datastore信息:

https://github.com/mkuzmin/telegraf

相信这个esxi 插件以后会被 telegraf 官方社区收录。

安装、配置上述链接中的telegraf,确保将数据写入 influxdb。参考配置:

[[inputs.vsphere]]
server = "192.168.1.4"
username = "root"
password = "******"
insecure = true
hosts = ["*"]
datastores = ["*"]
virtual_machines = ["*"]

三、创建 grafana dashboard

基于 telegraf 抓取到的 host, datastore, vm 数据,灵活运用 grafana dashboard 的各种图表类型,创建自己的 esxi 监控仪表盘。可以参考 grafana dashboard 网站上的模板:

https://grafana.com/dashboards

https://grafana.com/dashboards/1443

下面是我创建的 esxi 监控仪表盘:

[系统集成] 基于telegraf, influxdb, grafana 建立 esxi 监控

[系统集成] 基于telegraf, influxdb, grafana 建立 esxi 监控

四、创建报警

由于目前 grafana 不能在 template 类型(含有参数)的 dashboard上创建报警,因此需要再建立一个普通类型的 dashboard,专门放报警图表。

[系统集成] 基于telegraf, influxdb, grafana 建立 esxi 监控

上一篇:prototype.js 和 jQuery.js中 ajax 的使用


下一篇:node.weiChat