ECS服务器CPU使用率异常100%问题排查

服务器莫名其妙的出现了CPU使用率100%,而且top、htop等一些命令,都无法查询到消耗CPU,这时会陷入到困境,是什么消耗了CPU资源?

可以参考以下的方式,进行分析排查,确定问题原因。

1、在ECS控制台上,查询服务器的CPU使用监控数据,检查CPU是从什么时候开始出现使用率100%。
现象是不是从某一刻起,CPU突然100%,而且一直没有下降。

2、查看系统命令在最近时间是否有修改过。
stat /usr/bin/top
stat /bin/ps
查看命令的 Change时间,是否是和CPU使用率出现100%的时间点吻合。

ECS服务器CPU使用率异常100%问题排查

3、rpm 验证一下命令是否有被修改。
正常情况应该是查看不到修改信息的
rpm -Vf /bin/ps
rpm -Vf /usr/bin/top

ECS服务器CPU使用率异常100%问题排查

4、观察服务器对外的网络连接情况。
iftop -i eth1 -n -P
是否对外连接一些异常的地址,例如 crypto-pool.fr 之类的异常域名地址

ECS服务器CPU使用率异常100%问题排查

总结:符合以上几个特征,基本可以判定,服务器系统已经中招,中毒了。
尽快备份一下服务器的数据,考虑重装系统,然后加强服务器系统的安全防护。

上一篇:内存太大导致老软件不能运行的解决方案


下一篇:Java线程:线程的同步与锁