开发者学堂课程【运维监控系统第一课时:运维监控系统建设】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/805/detail/13879
运维监控系统建设
内容简介:
一.运维监控系统简介
三.运维监控系统流程
一.运维监控系统简介
l 监控系统就是一套解决应用、服务或系统故障发现、故障预警、故障定位,运行状态展示等多种功能融合一体的一个解决文案。也可以称之为一套系统。
l 监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题。
l 监控系统的核心是数据的采集和处理。
分类
l 应用性能监控(Application Performance Monitoring)
l 业务交易监控(Business Transaction Monitoring)
l 网络性能监控(Network Monitoring)
l 操作系统监控(System Monitoring)
l 网络站点监控(Website Monitoring)
二.对运维监控系统的设计目标
l 对系统、服务或平台的运行状态实行实时不间断监控
l 不间断实时反应系统、服务或平台的运行状态信息
l 提前预知可能存在的故障风险
l 实现故障预警报警功能通过监控数据快速定位故障原因最终保证系统持续、稳定、安全运行
l 状态数据可视化与统计、导出、归档(历史数据可追溯)
三.运维监控系统流程
工作原理:监控系统一般可以分为两部分:数据采集部分和数据展示部分。数据展示部分还承担了数据告警等职责。
数据采集协议:根据面临的场景不同,监控系统往往支持不同的数据采集协议。私有协议:监控系统自研的客户端,采用私有协议采集数据;公开协议:常见的协议包括SNMP、IPMI、SSH、Telnet 等协议。
运营监控系统的采集模式
l 主动采集模式: Push模式,客户端主动上报数据到服务器端
l 被动采集模式: Pull 模式,从服务器端到客户端采集数据
结论:被动模式对监控控制端服务器的开销较大,适合小规模的监控环境;主动模式对监控控制端服务器的开销较小,适合大规模的监控环境。
运维监控系统的代理架构
l 对于结构筒単的系统,可以采用筒単的Client/ Server模式迸行监控.
l 对于复杂的系统,需要在Client/ Server中向加入Proxy,对数据进行简单的处理.
常见开源监控解决方案