JavaCore/HeapDump文件及其分析方法

产生时间

  Java程序运行时,有时会产生JavaCore及HeapDump文件,它一般发生于Java程序遇到致命问题的情况下。

  有时致命问题发生后,Java应用不会死掉,还能继续运行;

  但有时致命问题发生,Java进程会死掉;

  为了能够保留Java应用发生致命错误前的运行状态,JVM在死掉前产生两个文件,分别为JavaCore及HeapDump文件。

  有何区别

  JavaCore是关于CPU的,而HeapDump文件是关于内存的。

  JavaCore文件主要保存的是Java应用各线程在某一时刻的运行的位置,即JVM执行到哪一个类、哪一个方法、哪一个行上。它是一个文本文件,打开后可以看到每一个线程的执行栈,以stack trace的显示。通过对JavaCore文件的分析可以得到应用是否“卡”在某一点上,即在某一点运行的时间太长,例如数据库查询,长期得不到响应,最终导致系统崩溃等情况。

  HeapDump文件是一个二进制文件,它保存了某一时刻JVM堆中对象使用情况,这种文件需要相应的工具进行分析,如IBM Heap Analyzer这类工具。这类文件最重要的作用就是分析系统中是否存在内存溢出的情况。

  怎么生成

  这两个文件可以用手工的方式生成,当我们会遇到系统变慢或无响应的情况,这时就以采用手工的方式生成JavaCore及HeapDump文件。

  在Unix/Linux上,产生这两个文件的方法如下:

 

  1. # ps -ef | grep java  

  2. user 4616 4582 0 17:30 pts/0 00:00:00 grep java  

  3. root 5580 1 0 Oct27 ? 00:02:27 /usr/bin/java -server -XX:PermSize=64M -XX:MaxPermSize=128m -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Djava.util.logging.config.file=/usr/local/tomcat8090/conf/logging.properties -Djava.endorsed.dirs=/usr/local/tomcat8090/endorsed -classpath :/usr/local/tomcat8090/bin/bootstrap.jar -Dcatalina.base=/usr/local/tomcat8090 -Dcatalina.home=/usr/local/tomcat8090 -Djava.io.tmpdir=/usr/local/tomcat8090/temp org.apache.catalina.startup.Bootstrap start  

  4. # kill -3 5580

 

  首先,找出Java进程id ,然后再执行‘kill -3 进程号’的操作,等文件生成后再做一次同样的操作,再产生一组文件。

  如何分析

  JavaCore文件

  两组文件在分析JavaCore时特别有效,因为它可以看出在先后两个时间点上,线程执行的位置,如果发现先后两组数据中同一线程都执行在同一位置,则说明此处可能有问题,因为程序运行是极快的,如果两次均在某一点上,说明这一点耗时是很大的,通过对这两个文件进行分析,查出原因,进而解决问题。

  JavaCore文件的头部有一个“Current Thread Details”标记,它记录了JavaCore产生时系统运行的线程id,使用线程id在文件中查找线程的详细信息,该信息中记载了线程运行哪个类的时候造成的JavaCore。

 

  1. NULL ------------------------------------------------------------------------  

  2. 0SECTION TITLE   subcomponent dump routine  

  3. NULL ===============================  

  4. 1TISIGINFOOUTOFMEMORY received  

  5. 1TIDATETIME Date: 2011/12/07 at 15:59:42  

  6. 1TIFILENAME Javacore filename:/usr/WebSphere/AppServer/profiles/WCSProdNode2/javacore19202086.1323298782.txt  

  7. NULL ------------------------------------------------------------------------  

  8. 0SECTION XHPI subcomponent dump routine  

  9. NULL   ==============================  

  10. 1XHTIME Wed Dec 7 15:59:42 2011  

  11. 1XHSIGRECV Unexpected   signal -1 received at   0x0 in <unknown>. Processing   terminated.  

  12. 1XHFULLVERSION J2RE 1.4.2 IBM AIX build ca142ifx-20090918 (SR13   FP2)  

  13. NULL            

  14. 1XHCURRENTTHD Current Thread   Details  

  15. NULL ----------------------  

  16. 2XHCURRSYSTHD "WebContainer :   5" sys_thread_t:0x45FB5328  

  17. 3XHNATIVESTACK Native Stack  

  18. NULL ------------  

  19. 3XHSTACKLINEERR unavailable -   stack address not valid  

  20. :::  

  21. :::  

  22. 0SECTION XM subcomponent   dump routine  

  23. NULL ============================  

  24. NULL             

  25. 1XMCURTHDINFO Current Thread Details  

  26. NULL ----------------------  

  27. 3XMTHREADINFO "WebContainer : 5" (TID:0x70A8E260, sys_thread_t:0x45FB5328, state:R, native ID:0x5CC0)   prio=5 

  28. 4XESTACKTRACE at   org.apache.taglibs.standard.tag.common.core.ImportSupport$ImportResponseWrapper.getString(Unknown   Source)  

  29. 4XESTACKTRACE at   org.apache.taglibs.standard.tag.common.core.ImportSupport.acquireString(Unknown   Source)  

  30. 4XESTACKTRACE at   org.apache.taglibs.standard.tag.common.core.ImportSupport.doEndTag(Unknown   Source)  

  31. 4XESTACKTRACE at   com.ibm._jsp._part._jspx_meth_c_import_3(_part.java(Compiled Code))  

  32. 4XESTACKTRACE at   com.ibm._jsp._part._jspx_meth_c_otherwise_3(_part.java(Compiled   Code))  

  33. 4XESTACKTRACE at   com.ibm._jsp._part._jspx_meth_c_choose_4(_part.java(Compiled Code))  

  34. 4XESTACKTRACE at   com.ibm._jsp._part._jspService(_part.java:3237)

 

  这样结合当时的日志文件可以找到问题产生的原因。不过,这种方法只能找到不是内存溢出的错误,对于在core文件头就有java/lang/outMemoryException的错误还是不知道是执行到哪个类的时候出现。

  HeapDump文件

  HeapDump文件是指定时刻的Java堆栈的快照,是一种镜像文件。Heap Analyzer工具通过分析HeapDump文件,哪些对象占用了太多的堆栈空间,来发现导致内存泄露或者可能引起内存泄露的对象。

 










本文转自 小强测试帮 51CTO博客,原文链接:http://blog.51cto.com/xqtesting/882893,如需转载请自行联系原作者
上一篇:思科CEO钱伯斯:物联网是第二代互联网


下一篇:RIP基础概念