java中JVM虚拟机内存模型详细说明

2022-11-05 13:41:26

java中JVM虚拟机内存模型详细说明

2012-12-12 18:36:03| 分类： JAVA | 标签：java jvm 堆内存虚拟机 |举报|字号订阅

JVM的内部结构如下图：

一个优秀Java程序员，必须了解Java内存模型、GC工作原理，以及如何优化GC的性能、与GC进行有限的交互，有一些应用程序对性能要求较高，例如嵌入式系统、实时系统等，只有全面提升内存的管理效率，才能提高整个应用程序的性能。

本文将从JVM内存模型、GC工作原理，以及GC的几个关键问题进行探讨，从GC角度提高Java程序的性能。

1 java内存分为：

程序计数器（当前线程所执行字节码的行号指示器，字节码解释器要通过改变这个计数器的值来选择下一条字节码指令，分支、循环、异常处理等。每条线程都有一条独立的程序计数器，属于线程私有的内存区）、

java虚拟机栈（也是线私有的，存储局部变量、操作栈，每个方法执行时创建一个栈帧，执行过程就是栈的出栈入栈操作）、

本地方法栈（执行native方法）、

年轻代堆（eden、from survivor、to survivor）、年老代堆(经过几次垃圾回收，保存下来的)、

持久代堆（也叫方法区，保存常量池和类型数据信息，不会被回收）、

直接内存（使用native方法直接分配堆外内存，再通过堆内的DirectByteBuffer作为这块内存的引用进行操作）

2 对象访问有两种：通过句柄池和直接通过指针，句柄池的好处是垃圾回收后，不需要改变对象引用，只要改变句柄引用；直接指针的好处是效率较高。

引用《深入java虚拟机第二章》

解释了minor gc和major gc，和两个survivor区之于复制收集算法的意义

3 jvm内存机制

java内存中的四种引用解析，强引用、弱引用、软引用、虚引用

4 垃圾回收算法

4.1 引用计数，效率高，但是无法解决无用对象循环引用的问题。及时引用计数大于0，但却不可用。

4.2 根对象可达，java虚拟机使用的方式。可以作为根对象的有：虚拟机栈帧中引用的对象，方法区中（持久区）类静态属性引用的对象（类静态属性在创建实例之前就已经为这个属性分配好空间，创建好实例，在所有的类实例*享），方法区中常量引用的对象（比如常量字符串），本地方法栈中引用的对象（native方法）。

4.3 引用强度，强（即传统理解的引用，obj=new obj()），软（softReference，在内存溢出之前，GC会将这部分纳入回收范围，进行二次回收，如果还是没有足够内存，那么OOM），弱（weakReference,一旦GC进行回收，无论内存是否充足都会被回收），虚（有虚引用不会影响生命周期，无法通过虚引用来获得一个对象，唯一作用是对象被回收时能得到一个系统通知，PhantomReference）

4.4 对象在回收之前会调用仅有一次finalize()，可以在finalize中自救，把自己被引用。只有当对象覆盖finalize()方法才会被放入执行finalize（）的队列。不建议使用这个，可以用try{} finally代替。

4.5 java回收算法

标记清除法，效率低下，会产生内存碎片。

复制收集算法，较为主流的算法，分区，eden,survivor，将未被回收的对象移动到survivor区，然后一次性清理eden区。这种算法适用于对象存活率不高的情况，要牺牲一部分分配空间，一般来说eden:survivor=8:1。

当对象存活率很高的时候，复制收集算法的效率会出现问题，所以有了标记-整理算法。把所有存活对象整理到一端，再把另一端直接清理掉。

分代算法，java内存一般都分为新生代和年老代，根据两个区域对象存活率的特点，分别采用了复制-收集算法和标记-清理（标记-整理）算法。

4.6 垃圾收集器

serial收集器，单线程收集。很可恶，会停掉其他用户线程。糟糕的用户体验。但是适用于client端，因为产生的垃圾量少，回收快，几十毫秒解决。

parNew收集器，和serial一样。区别是收集时采用多线程机制。

CMS收集器，可以让收集线程和用户线程并发执行，可惜的是作为年老代的收集器，只能和上面两个不靠谱的收集器一起配合使用。它是以最短停顿时间为目标的年老代收集器，使用mark-sweep算法（标记-清除）。回收步骤是初始标记（stop world）,并发标记，重新标记（stop world），并发清除。stop world的时间很短，所以可以认为是用户线程并发的收集器。

parallel scavenge收集器，是并发收集器，可以和用户线程并存。可以通过参数控制吞吐量=用户线程时间/（用户时间+垃圾收集时间），前台程序适用低吞吐量，减少用户操作每次停顿的时间；而后台程序适用于高吞吐量，尽快完成后台的计算。也称作吞吐量优先收集器。该收集器还能设置自适应模式，会根据实际情况动态调整吞吐量。

serial old收集器和serial一样，用于年老代收集。使用标记整理算法。

parallel old收集器，用于和parallel scavenge配合使用的年老代收集器，是parallel scavenge的最佳搭档。

G1(garbage first)收集器，最前沿的，jdk1.6进入试用期。采用标记-整理算法，并且对新生区分区，分区有不同的优先级，优先收集内存较满的区域。有着很高的并发和较低的停顿，也算是敏捷的一种收集器。

5 基本经验

minor gc是运行在新生代的gc，major GC是运行在年老代的GC，比minor慢十倍。

大对象很有可能直接进入年老代，程序中尽量避免短命大对象（数组、列表）。

一次minor没被收集，从eden进入survivor，每过一次GC,survivor加一岁，直到N岁进入年老区。

根据GC的工作原理，我们可以通过一些技巧和方式，让GC运行更加有效率，更加符合应用程序的要求。一些关于程序设计的几点建议：

1）最基本的建议就是尽早释放无用对象的引用。大多数程序员在使用临时变量的时候，都是让引用变量在退出活动域（scope）后，自动设置为 null.我们在使用这种方式时候，必须特别注意一些复杂的对象图，例如数组，队列，树，图等，这些对象之间有相互引用关系较为复杂。对于这类对象，GC 回收它们一般效率较低。如果程序允许，尽早将不用的引用对象赋为null，这样可以加速GC的工作。

2）尽量少用finalize函数。finalize函数是Java提供给程序员一个释放对象或资源的机会。但是，它会加大GC的工作量，因此尽量少采用finalize方式回收资源。

3）如果需要使用经常使用的图片，可以使用soft应用类型。它可以尽可能将图片保存在内存中，供程序调用，而不引起OutOfMemory.

4）注意集合数据类型，包括数组，树，图，链表等数据结构，这些数据结构对GC来说，回收更为复杂。另外，注意一些全局的变量，以及一些静态变量。这些变量往往容易引起悬挂对象（dangling reference），造成内存浪费。

5）当程序有一定的等待时间，程序员可以手动执行System.gc()，通知GC运行，但是Java语言规范并不保证GC一定会执行。使用增量式GC可以缩短Java程序的暂停时间。

码农公寓

java中JVM虚拟机内存模型详细说明

相关文章