Promethus(普罗米修斯)监控系统
学习目标
- 能够安装prometheus服务器
- 能够通过安装node_exporter监控远程linux
- 能够通过安装mysqld_exporter监控远程mysql数据库
- 能够安装grafana
- 能够在grafana添加prometheus数据源
- 能够在grafana添加监控cpu负载的图形
- 能够在grafana图形显示mysql监控数据
- 能够通过grafana+onealert实现报警
任务背景
某某某公司是一家电商网站,由于公司的业务快速发展,公司要求对现有机器进行业务监控,责成运维部门来实施这个项目。
任务要求
1)部署监控服务器,实现7x24实时监控
2)针对公司的业务及研发部门设计监控系统,对监控项和触发器拿出合理意见
3)做好问题预警机制,对可能出现的问题要及时告警并形成严格的处理机制
4)做好监控告警系统,要求可以实现告警分级
- 一级报警 电话通知
- 二级报警 微信通知
- 三级报警 邮件通知
5)处理好公司服务器异地集中监控问题,K8S内部使用的监控系统就是普罗米修斯
任务分析
为什么要监控?
答: 实时收集数据,通过报警及时发现问题,及时处理。数据为优化也可以提供依据。
监控四要素:
-
监控对象 [主机状态 服务 资源 页面,url]
-
用什么监控 [zabbix-server zabbix-agent] => 普罗米修斯监控
-
什么时间监控 [7x24 5x8]
-
报警给谁 [管理员]
项目选型:
-
mrtg (Multi Router Traffic Grapher)通过snmp协议得到设备的流量信息,并以包含PNG格式的图形的HTML文档方式显示给用户。
-
cacti (仙人掌) 用php语言实现的一个软件,它的主要功能是用snmp服务获取数据,然后用rrdtool储存和更新数据。官网地址: https://www.cacti.net/
-
ntop 官网地址: https://www.ntop.org/
-
nagios 能够跨平台,插件多,报警功能强大。官网地址: https://www.nagios.org/
-
centreon 底层使用的就是nagios。是一个nagios整合版软件。官网地址:https://www.centreon.com/
-
ganglia 设计用于测量数以千计的节点,资源消耗非常小。官网地址:http://ganglia.info/
-
open-falcon 小米发布的运维监控软件,高效率,高可用。时间较短,用户基数小。官网地址: http://open-falcon.org/
-
zabbix 跨平台,画图,多条件告警,多种API接口。使用基数特别大。官网地址: https://www.zabbix.com/
-
prometheus 基于时间序列的数值数据的容器监控解决方案。官网地址: https://prometheus.io/
综合分析:Prometheus比较适合公司的监控需求