java程序——CPU过高100%及内存泄露排查

CPU过高

这类问题可以使用 top 命令观察一些,CPU 是不是都被 Java 程序占用了。比如下面这个截图:

java程序——CPU过高100%及内存泄露排查

服务器的 CPU 大多都被 Java 占用了。这正是我们之前生产上 CPU 过高的一个截图。

服务其CPU 还能超过 100%原因

在 Linux 上,多核 CPU 就会超过 100%。top 命令显示的是你的程序占用的 cpu 的总数,也就是说如果你是 4 核 cpu 那么 cpu 最高占用率可达 400%,top 里显示的是把所有使用率加起来。

CPU 过高,这说明程序在进行计算密集型的操作,或者是线程死锁,创建的线程过多等情况引起的。具体来说有哪些操作会导致 Java CPU 过高呢?

我总结了一下,一般有下面几种情况发生

.java 正则表达式使用不不当或者造成回溯导致CPU %
.java线程死锁,程序hang住
.程序死循环,跳不出循环
.不靠谱的算法

CPU过高排查

按照下面几个步骤执行即可

步骤一:

使用 top 命令,查看占用 CPU 最高的进程。

Linux 系统,输入 top 命令后,在输入大写 P,将以 CPU 占用率大小的顺序排列进程列表。

步骤二:

在执行“top -Hp 进程PID”命令。进程PID 是上一步 top 命令找出来的。

例如:执行

top -Hp 28174 -d 1 -n 1

命令,查出占 CPU 最高的线程。

java程序——CPU过高100%及内存泄露排查

发现 20766 是最耗 CPU 的线程,转换成 16 进制是 511e,再用 jstack 命令查看线程堆栈。

步骤三:

线程 ID 转化,可以使用 printf “0x%x\n” 20766 命令。

java程序——CPU过高100%及内存泄露排查

步骤四:

然后再执行

jstack -l 20765 | grep 511e -A 20

命令,查看线程堆栈信息。

java程序——CPU过高100%及内存泄露排查

内存泄漏

内存泄露一般都是 HashMap,ArrayList,或者数据流没被关闭,再者就是一些方法使用不当,漏洞等产生的内存泄露。比如 Jdk 1.6 中的 substring 等。

内存泄漏排查

泄漏排查过程如下

步骤一:

使用 jstat -gc pid 命令查看了 java 进程的 GC 状态。如果在频繁的发生 GC,那么你的程序肯定有问题。

例如下面的 Full Gc 一秒发生一次。

java程序——CPU过高100%及内存泄露排查

 步骤二:

需要保存了线程栈的现场和保存堆快照

//保存了线程栈的现场
jstack pid > jstack.log //保存堆快照
jmap -dump:format=b,file=heap.log pid

再然后重启服务,先让程序恢复可用。

步骤三:

再接下来看看线程是否正常,可以执行以下命令:

grep 'java.lang.Thread.State' jstack.log  | wc -l
或者
grep -A 'java.lang.Thread.State' jstack.log | grep -v 'java.lang.Thread.State' | sort | uniq -c |sort -n

看不出来也没关系,使用 MAT 分析 jvm heap。知道你找到占用内存最大的对象,查看具体的代码,解决问题,发布版本,更新程序。

java程序——CPU过高100%及内存泄露排查

上一篇:ARM-linux与Ubuntu开发工具NFS及流程


下一篇:UITextField 限制用户输入小数点后位数的方法