文章目录
背景
公司里有一个非常正常的线上的服务,采用的是Web系统部署在Tomcat中的方式来进行启动的。
但是有一段时间,我们突然收到一些反馈,说是这个服务非常的不稳定,经常会出现访问这个服务的接口的时候出现服务的假死问题。
一旦出现这种接口调用时服务假死的情况,相当于我们的这个服务就完全不可用了,因此收到了不少上游服务的反馈。
但是上游服务反馈了另外一个非常关键的情况,就是经常一段时间内无法访问这个服务的接口,但是过了一会儿又可以访问了!
也就是说,似乎每次系统假死都只是一段时间而已!
因此我们着手进行了下面一系列的排查,最终解决了这个问题。