第一次遇到因为网络导致dblink异常的等待时间
首先业务反馈在某个时刻出现链接超时,业务异常率较高,让我们配合查询数据库是否正常
根据应用提供的异常时间点,提取相应的ash报告
SQL*Net break/reset to client 这位哥排第一位,官方对于这个等待事件的解释:
还是要检测应用服务器到数据库服务器的网络是否正常
从数据库所在服务器的主机监控查看
在同一时刻也出现流量骤然为0的现象,说明网络确实出现异常
再登录主机查看网卡状态
发现数据库服务器的数据网卡在接受包过程中出现异常,并且观察一段时间,发现该异常率在持续增长
从应用服务器侧ping大包到数据库服务器,也出现个别丢包情况,问题比较严重
问题也就集中在这个网卡或者链路问题,逐个排查
思路:
调换两个网卡的尾纤,分别通过传输大文件来持续观察哪个网卡的异常率出现增长
如果依然是这个网卡,则说明这个网卡本身有问题;
如果是另外一个网卡,则说明尾纤有问题;
针对具体问题进行更换处理即可。