在这里对linux下、sun(oracle) JDK的线程资源占用问题的查找步骤做一个小结;linux环境下,当发现java进程占用CPU资源很高,且又要想更进一步查出哪一个java线程占用了CPU资源时,按照以下步骤进行查找:
-
先用top命令找出占用资源厉害的java进程id,如:
如上图所示,java的进程id为'12377',接下来用top命令单独对这个进程中的所有线程作监视:
-
1
top
-p 12377 -H
如图:
如上图所示,linux下,所有的java内部线程,其实都对应了一个进程id,也就是说,linux上的sun
jvm将java程序中的线程映射为了操作系统进程;我们看到,占用CPU资源最高的那个进程id是'15417',这个进程id对应java线程信息中
的'nid'('n' stands for 'native');-
要想找到到底是哪段具体的代码占用了如此多的资源,先使用jstack打出当前栈信息到一个文件里, 比如stack.log:
1jstack 12377 > stack.log
然后使用'jtgrep'脚本把这个进程号为'15417'的java线程在stack.log中抓出来:
1jtgrep 15417 stack.log
其中,'jtgrep'是自己随便写的一个shell脚本:
1
2
3
4
|
#!/bin/sh nid=`python -c "print hex($1)" `
grep -i $nid $2
|
道理很简单,就是把'15417'转换成16进制后,直接grep stack.log;可以看到,被grep出的那个线程的nid=0x3c39,正好是15417的16进制表示。