可观测性认证
summary
可观测性认证考试主要是考察你能否用 elastic
全家桶,通过对指标、日志、APM
和心跳信息等维度的数据进行采集,并在 kibana
里构建 machine learning
任务和告警。
主要考点
-
Uptime
- 通过配置和使用
Heartbeat
对进程或服务的生存状况进行监控 - 通过
Heartbeat
来监控服务是否可以通过ICMP
、TCP
、HTTP
等方式进行访问 - 通过
Kibana
里的Uptime
功能来监控服务的存活和可用性
- 通过配置和使用
-
Metrics
- 通过配置和使用
Metricbeat
来采集操作系统的信息 - 通过配置
Metricbeat
对应模块来采集指定服务的信息 - 通过
Kibana
里的Metrics
功能来分析和确定服务的功能指标
- 通过配置和使用
-
Logging
- 通过配置和使用
Filebeat
来采集系统日志 - 通过配置
Filebeat
对应模块来采集指定服务的日志 - 配置和使用
Filebeat
来持续的收集某个日志文件内的信息 - 使用
Kibana
里的Logs
功能来分析采集到ES
里的日志信息 - 用
Logs
功能查看和分析预先定义的基于日志的machine learning
任务
- 通过配置和使用
-
APM
- 配置和启动一个
APM
服务器把信息发给ES
集群 - 在
APM
服务里开启RUM
功能 - 通过
Kibana
里的APM
功能来分析APM
信息
- 配置和启动一个
-
Structuring and Processing Data
- 通过
Kibana
来定义和修改一个数据处理管道 - 配置
Metricbeat
和Filebeat
使用数据管道 - 配置数据处理管道,使用后面那一排功能
- 配置数据处理管道从现有的
index
里加载数据
- 通过
-
Working with Observability Data
- 通过
machine learning
从可观测性数据中发觉异常 - 在
kibana
里为可观测性数据定制一个machine learning
任务 - 定义和更改索引的
ilm
策略 - 在
kibana
Alerts
功能里设置一个告警
- 通过
考点分析
- 从描述上看应该是通过
kibana
来配合各种beats
对服务器、服务等信息进行监控 - 然后配合包括
ingest pipeline
、machine learning
、alerts
等功能对监控信息进行分析并对异常状态进行预警 - 从
ECE
的经验上来看,ECOE
的考试多半是实操多于原理,会考察的很广泛(涉及各种beats
的配置运行),但不会考的特别深入(比如插件开发之类的),主要目的是给用户一个基础的认知,在遇到类似监控场景时可以使用哪些工具进行基础的数据采集、分析和告警
考试建议
- 考试版本(till 2022年1月)
7.10.2
,具体的以当时考试为准 - 建议软件工程师、数据架构师、
DevOps
、SRE
、系统管理员等岗位的同学报考 - 建议对
ES
有基本认知,最好能考过ECE
的认证