场景描述
相信大家都了解 jps、jmap、jstack 等常用 java 堆栈输出命令,有过 dump、gc 分析的经验,面试中会经常被问到有关 JVM 问题,比如你是否了解你的程序在生产环境的基础配置,堆内存、栈内存怎么设置的,又是怎么估算的大小,或是垃圾回收器及回收垃圾算法的最佳使用策略。作为项目的核心开发人员,别把这些事当成是架构师要干的活,因为代码可是你一行一行码出来的,没人比你更清楚,你得负责从程序开发、黑白盒测试、项目验收、部署上线、集成交付、运维监控、用户体验等环节。越大的企业,项目模块分配的越细,这也并不代表你不需要了解整体系统的性能,其中任何一个环节出问题,都可能导致系统无法正常运行。
借由这次生产系统频繁宕机,我们总结一下 JVM 内存模型划分、JVM 启动堆内存相关参数配置及说明、各年龄代的垃圾回收器及回收过程、生产 GC 日志解读与分析、系统运行内存预估方法、启动参数如何优化等。希望通过这篇小记来和大家一起交流、一起学习。
正文
2.1 生产 GC日志文件
部分截图如下:
2.2 先看一下 jdk 1.8 的内存划分情况
按年龄划分为年轻代、老年代、元空间、本地方法区、虚拟机栈和程序计数器。下图详细说明了这几个内存分区的关系、JVM 参数说明、存储的相关内容及各内存分区的垃圾回收器及垃圾回收算法。
2.3 生产基础环境
说明如下:
JDK版本:jdk_1.8
Web容器:Tomcat
题外话:估计市面上都是玩微服务了吧,jdk 版本至少也得 1.8 以上,jdk 1.6 不支持 G1 这么好用的垃圾收集器,也不支持 lambda 表达式,以及其他好用的特性
2.4 生产 JVM 堆内存相关参数
设置如下:
// 初始堆大小-Xms4096M// 最大堆大小-Xmx4096M// 持久代最大值-XX:MaxPermSize=1024M//......
题外话:这份配置一看就有点问题,为什么到现在才发现,因为系统之前很少出现问题,之前也未设置GC日志记录参数,也未曾关心 JVM 参数设置,大家只是在原有的工程进行开发和维护。其中 -Xmn 年轻代未配置(-XX:NewRatio 年轻代与年老代所占比值也未配置),-XX:PermSize 持久代初始值未配置(存在动态扩容带来的性能消耗)等
2.5 截取生产一条 GC 日志
图解分析如下:
2019-11-20T17:15:38.906+0800: 672725.775: [GC 2019-11-20T17:15:38.907+0800: 672725.776: [ParNew: 143735K->15199K(153344K), 0.0485240 secs] 2568043K->2439507K(4177280K), 0.0497750 secs] [Times: user=0.20 sys=0.00, real=0.05 secs]
从以上 GC 日志文件结构图解可以清晰看出,线上生产环境的年轻代总内存大小分配约 150M,堆总内存大小约 4G,明显年轻代内存分配过小。每次 ParNew GC 老年代变化可以由堆内存大小变化和年轻代内存大小变化推算。
从下图 GC 日志可以看出,线上系统出现频繁 ParNew GC(即年轻代的 Minor GC),平均大约每 5 分钟进行一次 Minor GC,即一天平均执行 288 次之多,太可怕了吧!!!唉