Q:我所有的监控项都是通过自动发现获取的item和值,这个数据获取的时间是怎么控制的,现在感觉都是无序的,我想控制在每个整点的10分左右更新数据。
A:zabbix获取数据是轮询的。有时候数据会出现采集超时的情况,时间上并不是很好控制。建议是从zabbix自身、数据库等方面进行优化,减小采集item的耗时,这样数据获取的时间基本都不会有大的差距。
Q:那应该要怎么优化的能提供下思路吗,不知道改怎么优化
A:zabbix自身的优化,可以从自身的进程方面,比如poller过于繁忙,那么适当加大进程;数据库则是做表分区、存储过程;在硬件这块可以上ssd等。 在网上有很多zabbix优化的资料,你可以查下看看。
Q:好的,这个LLD获取数据的时间,是根据主机启动的时间开始获取的吗?
A:从启用监控的那个时间开始去获取数据。
Q:请问下,如果部署时候软件版本是5.0;新版本5.0.5;也升级到5.0.5、但是已有的Template还是5.0的,针对5.0 - 5.0.5中间这些版本新增修复的Template如何进行升级呢?有办法进行Template的更新吗?
A:部署一台5.0.5的,然后对比下template,有差别对比后再决定是否要导入更新上。 如果目前监控是满足需求的,也可以不做模板的升级。
Q:最近监控trap告警,有几个疑惑请帮忙:
在trap中,示 SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.114,而不是HUAWEI-SERVER-IBMC-MIB::hwRAIDRebuildDeassert, 把HUAWEI-SERVER-iBMC-MIB.mib文件放到mibdir目录了,如下图:
A:你最后要达到的目的是什么呢?
Q:看网上别人配置后显示是这样的,比数字好理解:
看着数字不明白是什么意思,还需要对照文档才能理解每个参数
Q:还有一个问题,一条trap告警信息有重复发送的情况,也就是隔一段时间又发送一次,为避免这总情况,我创建了一个fallback,给每种trap错误创建了一个触发器, {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113)}=1 跟 {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1)}=1同时存在的情况下,后一个被触发,前一个永远无法触发。
我想问一下,trap告警这样处理合适吗? 表达式如何写才能避免这种情况A:2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113是 RAID rebuild detected,2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1是Storage device presence detected。
我刚模拟了下,你这边做依赖是可以实现的。个人是觉得根据不同trap OID 分多个成监控项会比较方便。
Q:谢谢,我试试依赖,分多个监控项也有同样的问题,就是1 和113会先匹配1
Q:大神也帮我看看呀,为什么显示问题呢?
A:你这里监控项返回的值不等于0,就触发了告警了