逃逸分析 (Escape Analysis）

2024-02-03 21:07:58

逃逸分析 (Escape Analysis）

什么是逃逸？

逃逸分析（Escape Analysis）是目前Java虚拟机中比较前沿的优化技术，它与类型继承关系分析一样，并不是直接优化代码的手段，而是为其他优化手段提供依据的分析技术。

逃逸分析的基本行为就是分析对象动态作用域：当一个对象在方法中被定义后，它可能被外部方法所引用，例如作为调用参数传递到其他方法中，称为方法逃逸。甚至还有可能被外部线程访问到，譬如赋值给类变量或可以在其他线程中访问的实例变量，称为线程逃逸。

如果能证明一个对象不会逃逸到方法或线程之外，也就是别的方法或线程无法通过任何途径访问到这个对象，则可能为这个变量进行一些高效的优化，如下所示。

下面举几个例子

public static StringBuffer createStringBuffer(String s1, String s2) {
    StringBuffer sb = new StringBuffer();
    sb.append(s1);
    sb.append(s2);
    return sb;
}
public static String createStringBuffer(String s1, String s2) {
    StringBuffer sb = new StringBuffer();
    sb.append(s1);
    sb.append(s2);
    return sb.toString();
}

第一段代码中的 sb 就逃逸了，而第二段代码中的 sb 就没有逃逸。

public static Object globalVariableObject;
public Object instanceObject;
public void globalVariableEscape(){
    //外部线程可见,发生对象逃逸
    globalVariableObject = new Object(); 
}
public void instanceObjectEscape(){
    //外部线程可见,发生逃逸
    instanceObject = new Object(); 
}
public Object returnObjectEscape(){
    //返回对象实例,外部线程可见，发生逃逸
    return new Object();  
}
public void noEscape(){
    //仅创建线程可见,对象无逃逸
    Object noEscape = new Object();  
}

逃逸分析优化JVM原理

栈上分配（Stack Allocation）

Java虚拟机中，在Java堆上分配创建对象的内存空间几乎是Java程序员都清楚的常识了，Java堆中的对象对于各个线程都是共享和可见的，只要持有这个对象的引用，就可以访问堆中存储的对象数据。虚拟机的垃圾收集系统可以回收堆中不再使用的对象，但回收动作无论是筛选可回收对象，还是回收和整理内存都需要耗费时间。如果确定一个对象不会逃逸出方法之外，那让这个对象在栈上分配内存将会是一个很不错的主意，对象所占用的内存空间就可以随栈帧出栈而销毁。在一般应用中，不会逃逸的局部对象所占的比例很大，如果能使用栈上分配，那大量的对象就会随着方法的结束而自动销毁了，垃圾收集系统的压力将会小很多。这个简单来说就是把对象分解成一个个基本类型，并且内存分配不再是分配在堆上，而是分配在栈上。这样的好处有，一、减少堆内存使用。二、GC频率也会减少。

栈上分配实验

同步消除（Synchronization Elimination）

线程同步本身是一个相对耗时的过程，如果逃逸分析能够确定一个变量不会逃逸出线程，无法被其他线程访问，那这个变量的读写肯定就不会有竞争，对这个变量实施的同步措施也就可以消除掉。

同步消除实验

public void synchronizationElimination() {
　Object seo = new Object();
　　synchronized(seo) {
　　　　System.out.println(seo);
　　}
}

代码中对seo这个对象进行加锁，但是seo对象的生命周期只在synchronizationElimination()方法中，每个线程进入到方法synchronizationElimination()时，都会创建一个seo对象，并不会被其他线程所访问到，所以在JIT编译阶段就会被优化掉。优化成：

public void synchronizationElimination() {
　　Object seo = new Object();
　　System.out.println(seo);
}

标量替换（Scalar Replacement）

标量（Scalar）是指一个数据已经无法再分解成更小的数据来表示了，Java虚拟机中的原始数据类型（int、long等数值类型以及reference类型等）都不能再进一步分解，它们就可以称为标量。相对的，如果一个数据可以继续分解，那它就称作聚合量Aggregate），Java中的对象就是最典型的聚合量。如果把一个Java对象拆散，根据程序访问的情况，将其使用到的成员变量恢复原始类型来访问就叫做标量替换。如果逃逸分析证明一个对象不会被外部访问，并且这个对象可以被拆散的话，那程序真正执行的时候将可能不创建这个对象，而改为直接创建它的若干个被这个方法使用到的成员变量来代替。将对象拆分后，除了可以让对象的成员变量在栈上（栈上存储的数据，有很大的概率会被虚拟机分配至物理机器的高速寄存器中存储）分配和读写之外，还可以为后续进一步的优化手段创建条件。

标量替换实验

@Data
public class Person{
	Integer age;
	String name;
	Doubel height;
}


public void scalarReplacement() {
	//new Person();
	//在对象未逃逸的情况下
	//标量替换后的伪代码　　
	int age = 0;
	doubel = 0;
	String = "name";
}

逃逸分析实验

public static void main(String[] args) {
    test1();
    test2();
}
//对象无逃逸
public static void test1() {
    int b;
    long s = System.currentTimeMillis();
    for (int i = 0; i < 1000000000; i++) {
        b =  i;
    }
    long e = System.currentTimeMillis();
    System.out.println("test1 execution is completed in   " +  (e - s) + "   millisecond");
}
//对象逃逸
static int a;
public static void test2() {
    long s = System.currentTimeMillis();
    for (int i = 0; i < 1000000000; i++) {
        a =  i;
    }
    long e = System.currentTimeMillis();
    System.out.println("test2 execution is completed in  " +  (e - s) + "  millisecond");
}

可以看到很明显的效果
test1 execution is completed in 4 millisecond

test2 execution is completed in 46 millisecond

关于逃逸分析

开启逃逸分析

如果有需要，并且确认对程序运行有益，用户可以使用参数-XX：+DoEscapeAnalysis来手动开启逃逸分析，开启之后可以通过参数-XX：+PrintEscapeAnalysis来查看分析结果。有了逃逸分析支持之后，用户可以使用参数-XX：+EliminateAllocations来开启标量替换，使用+XX：+EliminateLocks来开启同步消除，使用参数-XX：+PrintEliminateAllocations查看标量的替换情况。

参考资料

《深入理解Java虚拟机》

逃逸分析缺点

关于逃逸分析的论文在1999年就已经发表，但直到Sun JDK 1.6才实现了逃逸分析，而且直到现在这项优化尚未足够成熟，仍有很大的改进余地。不成熟的原因主要是不能保证逃逸分析的性能收益必定高于它的消耗。如果要完全准确地判断一个对象是否会逃逸，需要进行数据流敏感的一系列复杂分析，从而确定程序各个分支执行时对此对象的影响。这是一个相对高耗时的过程，如果分析完后发现没有几个不逃逸的对象，那这些运行期耗用的时间就白白浪费了，所以目前虚拟机只能采用不那么准确，但时间压力相对较小的算法来完成逃逸分析。还有一点是，基于逃逸分析的一些优化手段，如上面提到的“栈上分配”，由于HotSpot虚拟机目前的实现方式导致栈上分配实现起来比较复杂，因此在HotSpot中暂时还没有做这项优化。

码农公寓