JVM笔记 | Java垃圾回收(GC)

概述

在JVM的运行时数据区中,程序计数器、JVM栈和本地方法栈随线程而生,随线程而灭,内存分配和回收具备确定性,因此这几个区域不需要过多考虑内存回收问题,因为方法结束或者线程结束时,内存自然就跟随着回收了。而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,只有在程序处于运行期才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关心的是这部分内存。

对象存活判定算法

在堆中存放着Java世界中几乎所有的对象实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象中哪些还“存活”着,那些已经“死去”(即不可能再被任何途径使用的对象)

1. 引用的概念

在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用、软引用、弱引用和虚引用四种,这四种引用强度依次减弱。

  • 强引用(Strong Reference)
    • 指创建一个对象并把这个对象赋值给一个引用变量
      Object obj = new Object();
    • 只要强引用存在,即使抛出OutOfMemoryError异常,垃圾收集器也不会回收被引用的对象。
  • 软引用(Soft Referrence)
    • 用来描述一些还有用但非必须的对象。
    • 对于软引用关联的对象,在内存不足时会被回收。
  • 弱引用(Weak Reference)
    • 用来描述非必须对象,但强度比软引用更弱。
    • 无论当前内存是否足够,都会被回收。
  • 虚引用(Phantom Reference)
    • 不影响对象生存时间,也无法通过虚引用取得对象实例。
    • 存在意义在于与引用队列关联使用,判断被虚引用关联的对象是否即将被回收。

推荐阅读:Java的四种引用方式

2. 引用计数算法

  • 实现方式:给对象中添加一个引用计数器,每当有一个地方去引用它,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器值为0的对象就是不可能再被使用的。
  • 这种算法实现简单、判定效率高,但是很难解决对象之间相互循环引用的问题。
  • 虚拟机不是通过引用计数算法来判断对象是否存活。

3. 可达性分析算法

  • 实现方式:通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,证明此对象是不可引用的。
    JVM笔记 | Java垃圾回收(GC)
  • 在Java中,可作为GC Roots的对象包括以下几种:
    • JVM栈(栈帧中的本地变量表)中引用的对象;
    • 方法区中类的静态属性引用的对象;
    • 方法区中常量引用的对象;
    • 本地方法栈中JNI(即常说的Native方法)引用的对象。
  • 当然,可达性分析算法中不可达的对象并不是一定会被回收,如果这个对象在执行finalize()方法时,重新与引用链上的对象关联起来,就会被移除出“即将回收”集合。

4. 方法区回收

  • JVM规范中说过可以不要求JVM在方法区实现垃圾回收,方法区的垃圾回收效率十分低。
  • 方法区的垃圾回收主要回收两部分内容:
    • 废弃常量的回收与Java堆中对象的回收十分类似,即没有被任何其他地方引用就会被回收。
    • 满足以下条件会被判定为无用的类
      • 该类所有的实例都已经被回收,即Java堆中不存在该类的任何实例;
      • 加载该类的 ClassLoader 已经被回收;
      • 该类对应的 java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
垃圾收集算法

首先可以先看看下面这篇博客,了解一下新生代和老年代的概念:新生代和老年代
接下来介绍几种垃圾收集算法。

1. 复制算法

  • 算法思想:将可用内存按容量划分为大小相等的两块,每次只使用其中给一块,当这一块的内存用完了,就将还存活的对象复制到另一块,再将已使用的一块内存全部清理掉。
  • 优点:每次都对整个半区进行回收,不会产生内存碎片,实现简单,运行高效。
  • 缺点:相当于将可用内存缩小为一半,使用率太低。
    JVM笔记 | Java垃圾回收(GC)

2. 标记—清除算法

  • 算法思想:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
  • 不足:
    • 标记和清除两个过程的效率都不高;
    • 标记清除后会产生大量不连续的内存碎片,造成后面无法为较大对象分配空间,频繁触发垃圾收集,影响系统性能。
      JVM笔记 | Java垃圾回收(GC)

3. 标记—整理算法

  • 算法思想:首先标记出所有需要回收的对象,然后将所有存活的对象移动到一端,然后直接清理端边界以外的全部内存。
  • 优点:可以应对大量对象存活,只有少量内存需要回收的情况,适合老年代使用。
    JVM笔记 | Java垃圾回收(GC)

4. 分代收集算法

  • 这种算法被当代虚拟机广泛使用。
  • 算法思想:根据对象存活周期将Java堆分为新生代和老年代,分别使用合适的算法进行垃圾收集。
    • 新生代对象存活率低,使用复制算法,只需付出少量存活对象的复制成本就可以完成收集。

    IBM公司的专门研究表明,新生代中的对象98%是“朝生夕死”,所以可以将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor空间。回收时,将这两块空间中存活的对象复制到另一块Survivor空间中,最后清理掉Eden和Survivor空间。这样空间使用率就达到了90%。当然我们不能保证每次都只有不多于10%的对象存活,这时就需要依赖老年代空间进行分配担保,即让survivor空间存放不下的对象通过分配担保机制进入老年代。

    • 老年代对象存活率高,使用标记—清理算法或者标记—整理算法。

上一篇:JVM笔记 | Java内存管理

上一篇:云上持续交付实践系列4 --- node 篇


下一篇:LearnJava(二) String