Promethus(普罗米修斯)监控系统01学习目标

Promethus(普罗米修斯)监控系统

学习目标

  • 能够安装prometheus服务器
  • 能够通过安装node_exporter监控远程linux
  • 能够通过安装mysqld_exporter监控远程mysql数据库
  • 能够安装grafana
  • 能够在grafana添加prometheus数据源
  • 能够在grafana添加监控cpu负载的图形
  • 能够在grafana图形显示mysql监控数据
  • 能够通过grafana+onealert实现报警

任务背景

某某某公司是一家电商网站,由于公司的业务快速发展,公司要求对现有机器进行业务监控,责成运维部门来实施这个项目。

任务要求

1)部署监控服务器,实现7x24实时监控
2)针对公司的业务及研发部门设计监控系统,对监控项和触发器拿出合理意见
3)做好问题预警机制,对可能出现的问题要及时告警并形成严格的处理机制
4)做好监控告警系统,要求可以实现告警分级

  • 一级报警 电话通知
  • 二级报警 微信通知
  • 三级报警 邮件通知

5)处理好公司服务器异地集中监控问题,K8S内部使用的监控系统就是普罗米修斯

任务分析

为什么要监控?
答: 实时收集数据,通过报警及时发现问题,及时处理。数据为优化也可以提供依据。
监控四要素:

  • 监控对象 [主机状态 服务 资源 页面,url]

  • 用什么监控 [zabbix-server zabbix-agent] => 普罗米修斯监控

  • 什么时间监控 [7x24 5x8]

  • 报警给谁 [管理员]

    项目选型:

  • mrtg (Multi Router Traffic Grapher)通过snmp协议得到设备的流量信息,并以包含PNG格式的图形的HTML文档方式显示给用户。

  • cacti (仙人掌) 用php语言实现的一个软件,它的主要功能是用snmp服务获取数据,然后用rrdtool储存和更新数据。官网地址: https://www.cacti.net/

  • ntop 官网地址: https://www.ntop.org/

  • nagios 能够跨平台,插件多,报警功能强大。官网地址: https://www.nagios.org/

  • centreon 底层使用的就是nagios。是一个nagios整合版软件。官网地址:https://www.centreon.com/

  • ganglia 设计用于测量数以千计的节点,资源消耗非常小。官网地址:http://ganglia.info/

  • open-falcon 小米发布的运维监控软件,高效率,高可用。时间较短,用户基数小。官网地址: http://open-falcon.org/

  • zabbix 跨平台,画图,多条件告警,多种API接口。使用基数特别大。官网地址: https://www.zabbix.com/

  • prometheus 基于时间序列的数值数据的容器监控解决方案。官网地址: https://prometheus.io/

综合分析:Prometheus比较适合公司的监控需求

上一篇:Grafana安装和升级


下一篇:grafana