概要
Java垃圾回收主要是发生在堆上,我们先来看看堆的结构图解
在之前的内存区域分析中我们知道,Java堆被分了新生代和老年代,而分代的目的就是为了更好的进行内存回收和分配。其实再细致一点分,我们可以将堆分为 Eden、From Survivor0、To Survivor1 和Old Memory 其中前三个就是我们所说的新生代,Old Memory就是老年代。
我们先在前面说明Java在堆上进行内存分配 的常见策略:
- 优先在Eden区分配
- 长期存活的对象进入老年代
- 大对象直接进入老年代
堆上所有的对象都是优先在Eden区进行的内存分配,经过一次新生代GC后进入到From区(这里的From区实际上是GC前的To区,而清空后的From区就是GC后的To区,这是为了保证To区一直是空的)而原本From区中能够晋升到老年代的将会进入老年代。那么我们来讲讲进入老年代的条件:
一般情况下,当对象的年龄大于某个值的时候它就会进入老年代,而这个值默认是15,也可以被用户通过参数-XX:MaxTenuringThreshold指定。但是当整个Survivor区的一半以上被占用时,那么从小到大排列,处于Survivor区一半上的那个对象的年龄会与指定的年龄进行比较,取较小值作为新的晋升年龄。
这里还有一种从From区进入到老年代的情况,就是说当GC后From区放不下全部的对象时,剩余的对象将直接进入到老年代。这里会涉及到一个分配担保机制。
分配担保机制是指让老年代进行空间分配担保。 在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间,如果大于,则此次Minor GC是安全的。如果小于,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败。如果HandlePromotionFailure=true,那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代的对象的平均大小,如果大于,则尝试进行一次Minor GC,但这次Minor GC依然是有风险的;如果小于或者HandlePromotionFailure=false,则改为进行一次Full GC。 JDK 6 Update 24之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小,就会进行 Minor GC,否则将进行 Full GC。
为什么之前我们要说堆上的对象优先在Eden区分配而不是所有呢?这里的分配担保机制就是关键。为了防止需要占用超大内存的对象在Eden分配后由于不能进入到Surivor而是通过分配担保机制进入到老年代,从而导致需要从Eden复制到Old Memory浪费资源,所以直接让它出现在老年代。这就是大对象直接进入老年代。
现在针对HotSpot VM 的实现来说一下它的GC
部分收集 :
- 新生代收集(Minor GC):只针对新生代进行垃圾回收;
- 老年代收集(Major GC):只针对老年代垃圾收集。
- 混合收集(Mixd GC):收集整个堆。
整堆收集(Full GC):收集整个Java堆和方法区
垃圾回收算法
标记-清除算法
该算法分为两步:标记和清除。首先会标记不需要回收的对象,在标记完成后统一回收没有标记的对象。
缺点:效率低,标记清除后容易产生碎片。
图解:
标记-复制算法
这种算法是将内存分为两块,一块用于内存分配,另一块空闲。当发生GC时就将标记的对象复制到另一块上,然后一次性将原来使用的那块内存空间清除。这不仅解决了效率问题,还使得内存得到了规整。(有没有觉得很熟悉???没错很像新生代中的Survivor 对不对 大家在后面就会知道了)
标记-整理算法
先将不需要清除的对象打上标记,然后让这些对象向一端移动,然后将端边界以外的所有内存进行清除。这样也对内存进行了规整。
分代收集算法
当前虚拟机的垃圾收集都采用的分代收集算法。也就是根据对象的不同存活周期将对象分为不同的几块内存块,然后采用合适的算法进行垃圾收集。比如Java的新生代和老年代。新生代一般采用标记-复制算法。老年代则是标记-清除或者标记-整理。
垃圾收集器
Serial 收集器
Serial (串行)收集器是一个单线程收集器,也就是说它只会使用一条线程去进行垃圾收集,并且在这期间,其它线程都必须停止工作。
新生代采用标记-复制算法,老年代采用标记-整理算法。
ParNew收集器
采用多线程进行垃圾回收,其余与Serial一致。它是许多运行在 Server 模式下的虚拟机的首要选择,除了 Serial 收集器外,只有它能与 CMS 收集器(真正意义上的并发收集器,后面会介绍到)配合工作。
新生代采用标记-复制算法,老年代采用标记-整理算法。
Parallel Scavenge 收集器
Parallel Scavenge 收集器也是使用标记-复制算法的多线程收集器
Parallel Scavenge 收集器关注点是吞吐量(高效率的利用 CPU)。CMS 等垃圾收集器的关注点更多的是用户线程的停顿时间(提高用户体验)。所谓吞吐量就是 CPU 中用于运行用户代码的时间与 CPU 总消耗时间的比值。
新生代采用标记-复制算法,老年代采用标记-整理算法。
如何判断对象是否无效
我们在对垃圾进行回收之前会进行判断哪些对象需要被收回,也就是说已经无效。
首先我们来看一下整体的图解:
接下来我们介绍一下判断对象无效的两种方法:
引用计数法
顾名思义,引用计数法就是统计该对象被引用的次数。每当有一个地方引用它,计数器就加一;当引用失效就减一;当计数器为0时就表示当前情况下该对象不存在被使用的情况。
这个方法实现简单,效率高,但是目前主流的虚拟机中并没有选择这个算法来管理内存,其最主要的原因是它很难解决对象之间相互循环引用的问题。
可达性算法
所谓的可达性算法就是通过一系列被称为 “GC ROOTs”的对象作为起点,从这些节点开始向下搜索,节点所走过的路径称为引用链,当一个对象到 GC Roots 没有任何引用链相连的话,则证明此对象是不可用的。
可作为 GC Roots 的对象包括下面几种:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 本地方法栈(Native 方法)中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 所有被同步锁持有的对象
不管是哪种方法,我们都用到了引用,所以Java引用我们来了解一下。
不可达对象并非“非死不可”
即使在可达性分析法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑阶段”,要真正宣告一个对象死亡,至少要经历两次标记过程;可达性分析法中不可达的对象被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行 finalize 方法。当对象没有覆盖 finalize 方法,或 finalize 方法已经被虚拟机调用过时,虚拟机将这两种情况视为没有必要执行。
被判定为需要执行的对象将会被放在一个队列中进行第二次标记,除非这个对象与引用链上的任何一个对象建立关联,否则就会被真的回收。
Java四大引用
1.强引用(StrongReference)
以前我们使用的大部分引用实际上都是强引用,这是使用最普遍的引用。如果一个对象具有强引用,那就类似于必不可少的生活用品,垃圾回收器绝不会回收它。当内存空间不足,Java 虚拟机宁愿抛出 OutOfMemoryError 错误,使程序异常终止,也不会靠随意回收具有强引用的对象来解决内存不足问题。
2.软引用(SoftReference)
如果一个对象只具有软引用,那就类似于可有可无的生活用品。如果内存空间足够,垃圾回收器就不会回收它,如果内存空间不足了,就会回收这些对象的内存。只要垃圾回收器没有回收它,该对象就可以被程序使用。软引用可用来实现内存敏感的高速缓存。
软引用可以和一个引用队列(ReferenceQueue)联合使用,如果软引用所引用的对象被垃圾回收,JAVA 虚拟机就会把这个软引用加入到与之关联的引用队列中。
3.弱引用(WeakReference)
如果一个对象只具有弱引用,那就类似于可有可无的生活用品。弱引用与软引用的区别在于:只具有弱引用的对象拥有更短暂的生命周期。在垃圾回收器线程扫描它所管辖的内存区域的过程中,一旦发现了只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存。不过,由于垃圾回收器是一个优先级很低的线程, 因此不一定会很快发现那些只具有弱引用的对象。
弱引用可以和一个引用队列(ReferenceQueue)联合使用,如果弱引用所引用的对象被垃圾回收,Java 虚拟机就会把这个弱引用加入到与之关联的引用队列中。
4.虚引用(PhantomReference)
"虚引用"顾名思义,就是形同虚设,与其他几种引用都不同,虚引用并不会决定对象的生命周期。如果一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收。
虚引用主要用来跟踪对象被垃圾回收的活动。
虚引用与软引用和弱引用的一个区别在于: 虚引用必须和引用队列(ReferenceQueue)联合使用。当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象的内存之前,把这个虚引用加入到与之关联的引用队列中。程序可以通过判断引用队列中是否已经加入了虚引用,来了解被引用的对象是否将要被垃圾回收。程序如果发现某个虚引用已经被加入到引用队列,那么就可以在所引用的对象的内存被回收之前采取必要的行动。
特别注意,在程序设计中一般很少使用弱引用与虚引用,使用软引用的情况较多,这是因为软引用可以加速 JVM 对垃圾内存的回收速度,可以维护系统的运行安全,防止内存溢出(OutOfMemory)等问题的产生。
如何判断常量为废弃常量
假如在字符串常量池中存在字符串 “abc”,如果当前没有任何 String 对象引用该字符串常量的话,就说明常量 “abc” 就是废弃常量,如果这时发生内存回收的话而且有必要的话,“abc” 就会被系统清理出常量池了
如何判断一个类是无用类
判定一个常量是否是“废弃常量”比较简单,而要判定一个类是否是“无用的类”的条件则相对苛刻许多。类需要同时满足下面 3 个条件才能算是 “无用的类” :
- 该类所有的实例都已经被回收,也就是 Java 堆中不存在该类的任何实例。
- 加载该类的
ClassLoader
已经被回收。 - 该类对应的
java.lang.Class
对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
虚拟机可以对满足上述 3 个条件的无用类进行回收,这里说的仅仅是“可以”,而并不是和对象一样不使用了就会必然被回收。