今天发现存储服务器业务不可用,服务器能ping通,远程不了! 到机房管理员那里查看服务器状态后,发现显示如下:
显然系统已经崩溃,只能先重启服务器,先恢复业务,然后针对backlog limit exceeded的告警查找原因
通过百度查找audit服务是linux的一个审计服务,上述原因是audit服务在繁忙的系统中进行审计事件操作,缓冲瓶颈,导致系统崩溃
在优化audit服务之前要先确保selinx是disabled状态和磁盘正常,否则会出现重启服务器之后输入root密码的那个界面会提示只读等的字样
优化audit服务:#auditctl -b 8192(8192是kb单位,但是这个值要根据系统的实际情况设置)
以上只是临时生效,重启服务器还是会重置为默认值,可以将auditctl -b 8192写入/etc/rc.local