[zabbix社群QA] “专家坐诊”第21期问答汇总

2024-04-06 14:50:07

Q:如何让告警一直在主面板显示，除非我人工确认
A:选择最近问题，可以看到最近的所有问题，包括已恢复的问题

Q:【问题现象】
我的wlc host经常Timeout while connecting to "10.58.1.130:161".应该如何排查？
【问题前操作】
zabbix 通过自动发现检测到wlc上的800多ap,频率为5分钟。发现后，问题出现
【已做排查】
出现问题时，zabbix snmpwalk 能取到wlc 的ap信息。

A:zabbix_server.conf上设置的超时时间是多少？
Q:4

A:可以改为30，重启zabbix服务后看下是否还有这个问题。
Q:配置更改后已重启，问题还未恢复，还需要作其他操作吗？
A:需要等待监控项成功获取一次数据才会变成绿色。如果需要排查问题，需要在最新数据界面，找一下是否有部分监控项到了时间间隔，但是数据却没更新的。
Q:部分监控获取到了数据。另snmp监控 ap设置的5分钟间隔已过去

A:你的自动发现规则是怎么配置的？
Q:

A:那个自动发现规则里的snmp OID的内容可以复制出来吗？
Q:SNMPv2-SMI::enterprises.9.9.513.1.1.1.1.5.{#SNMPINDEX}
A:是第一张图的那个snmp OID的全部内容，我感觉是写错了
Qdiscovery[{#APNAME},SNMPv2-SMI::enterprises.9.9.513.1.1.1.1.5] ,这是第一张的
A:snmpwalk 这个OID返回的结果是怎样的？

Q:snmpwalk -v 2c -c public 10.58.1.130 enterprises.9.9.513.1.1.1.1.5
A:snmpwalk -v 2c -c public 10.58.1.130 enterprises.9.9.513.1.1.1.1.5.0.162.137.0.134.224 这个有数据吗？

还可以试下不勾选使用大量请求这个选项,使用大量请求这个选项再等5分钟左右看下吧
Q大量请求取消也已测过了,之前就取消了。
A:zabbix的日志有相关的信息吗？
Q:没看到相关信息

监控单个AP oid正常,是不是snmp批量通信问题？
A:是的，是真的有800多个AP在线吗？

Q：是的，有优化的资料没？

A:信息类型是字符来的,可以禁用一部分监控项，测试是否能够获取数据，如果能够获取数据，说明是同一时间获取的量太多导致，确定是这个问题后，如果还是只想通过zabbix的snmp监控，只能调整监控项的时间间隔。其他解决办法：可以通过脚本配合zabbix_sender，时间间隔5分钟获取一次数据。
Q:日志提示临时性关闭snmp agent,zabbix 能实现错峰收集自动发现的800AP信息吗？
A:目前还做不到

Q:自动发现网络接口过滤的那个后面的数字代表什么 1 2 3 5 7

A:对{#IFOPERSTATUS}这个宏的值进行过滤，只要值为1、2、3、4、5、7的

Q:生产环境中会在发现网络接口里过滤吗？如果过滤了down的下次发现接口刚好down那中间就会没有接口的数据吧
A:如果之前是up，自动发现接口down了以后，down的接口监控项会保留一段时间，这段时间里自动发现不了后，再删除，保留多长时间可以在自动发现规则里设置。如果之前是down的，接口up了之后，需要等自动发现时间间隔到了之后生成，这段时间没有监控数据。

https://support.huawei.com/enter ... e-12800-pid-7542409 这些信息，对应的设备的mib文件里会说明的，接口mib属于公有mib，所以其他设备的mib也能看到

Q:交换机流量的收发方向这样是正确的吗？

A:对的

本期待解决问题：
请问，我的一个windows server 2003主机，zabbix里经常出现cpu使用率超出100%的数据，这是什么原因啊？

码农公寓

相关文章