今天收到redis的keepalived vip无法ping通的告警,查看服务器和服务时发现vip在服务器上,服务也正常。只能在本机ping通,跨网段无法ping通。切换keepalived vip至slave后恢复,但是在切回master后过了一会又无法ping通。
故障原因:
一、keepalived和redis软件问题
1、登录master发现vip在服务器上正常,slave无vip,但是跨网段无法ping通,keepalived服务正常
2、查看tcpdump抓包,未发现有vrid相同的情况,如果相同从日志也能看出
tcpdump -i eth0 vrrp -n
二、服务器问题
1、防火墙关闭状态
2、selinux关闭
3、服务器所在云平台管理员反馈服务器正常
三、网络问题
1、网管反馈网络正常
2、有点怀疑是apr绑定的问题了,于是清理该vip的arp绑定
组合命令清楚所有arp缓存:
arp -n|awk '/^[1-9]/{system("arp -d "$1)}'
先清理master的arp,将vip切回至master,ping vip正常
再清理slave的arp
参考
keepalived vip 不能ping通!-qingheliu-ChinaUnix博客 http://blog.chinaunix.net/uid-20776139-id-5139371.html
linux 清除 arp 缓存 - Gino的专栏 - CSDN博客 https://blog.csdn.net/u011641885/article/details/48175239
Linux VIP(虚拟IP)配置后,无法ping通的问题处理 - 自慎 - CSDN博客 https://blog.csdn.net/zhang_shufeng/article/details/37930405