在部分商用虚拟机中,Java程序最初是通过解释器(Interpreter)进行解释执行的,当虚拟机发现某个方法或者代码块的运行特别频繁时,就会把这些代码认定为“热点代码”(Hot Spot Code)。为提高热点代码的执行效率,在运行时,虚拟机将会把这些代码编译成与本地平台相关的机器码,并进行这种层次的优化,完成这个任务的编译器成为即时编译器(Just In Time Compiler,简称JIT编译器)。
Java虚拟机规范并没有规定Java虚拟机必须要有即时编译器存在。但是,即时编译器编译性能的好坏、代码优化程度的高低确实衡量一款商用虚拟机优秀与否的关键指标之一,也是虚拟机中最核心且能体现虚拟机技术水平的部分。
HotSpot虚拟机内的即时编译器
将要了解HotSpot虚拟机内即时编译器的运作过程,同时,还要解决一下几个问题:
为何Hotspot虚拟机要使用解释器与编译器并存的架构?
为何Hotspot虚拟机要实现两个不同的即时编译器?
程序何时使用解释器执行?何时使用编译器执行?
那些程序代码会被编译为本地代码?如何编译为本地代码?
如何从外部观察即时编译器的编译过程和编译结果?
解释器与编译器
解释器与编译器两者各有优势:当程序需要迅速启动和执行的时候,解释器可以首先发挥作用,省去编译的时间,立即执行。在程序运行后,随着时间的推移,解释器逐渐发挥作用,把越来越多的代码编译成本地代码之后,可以获取更高的执行效率。当程序运行环境的内存资源有限制较大(如部分嵌入式系统),可以使用解释器执行节约内存,反之可以使用编译器执行来提升效率。同时,解释器还可以作为编译器激进优化时的一个“逃生门”,让编译器根据概率选择一些大多数时都能提升运行速度的优化手段,当激进优化的假设不成立,如加载了新类后类型继承结构出现变化、出现“罕见陷阱”(Uncommon Trap)时可以通过逆优化(Deoptimization)退回到解释状态继续执行,因此,整个虚拟机执行架构中,解释器与编译器经常配合工作。
Hotspot虚拟机中内置了两个即时编译器,分别为Client Compiler和Server Compiler,或者简称C1编译器和C2编译器。目前主流的Hotspot虚拟机中,默认采用解释器与其中一个编译器直接配合的方式工作,程序使用那个编译器,取决于虚拟机运行的模式,Hotspot虚拟机会根据自身版本与宿主机器的硬件性能自动选择运行模式,用户也可设置参数强制虚拟机使用的模式。
编译器和解释器搭配使用的方式成为“混合模式”(Mixed Mode),用户可设置参数强制虚拟机使用其中一种。
由于即时编译器编译本地代码需要占用程序运行时间,要编译出优化程度更高的代码,所花费的时间可能更长;而且想要编译出优化程度更高的代码,解释器可能还要替编译器做收集性能监控信息,这对解释执行的速度也有影响。为了在程序启动响应速度与运行效率之间达到最佳平衡,Hotspot虚拟机还会逐渐启用分层编译(Tiered Compilation)的策略。分层编译根据编译器编译、优化的规模与耗时,划分出不同编译层次:
第0层,程序解释执行,解释器不开启性能监控功能,可触发第1层编译。
第1层,也称C1编译,将字节码编译为本地代码,进行简单、可靠的优化,如有必要将加入性能监控的逻辑。
第2层(或2层以上),也称C2编译,将字节码编译为本地代码,但是会启用一些编译耗时较长的优化,甚至会根据性能监控信息进行一些不可靠的激进优化。
实施分层编译后,Client Compiler和Server Compiler将会同时工作,许多代码都可能会被多次编译,用Client Compiler获取更高的编译速度,用Server Compiler来获取更好的编译执行,在解释执行的时候也无须再承担收集性能监控信息的任务。
编译对象与触发条件
在运行中被即时编译器编译的“热点代码”有两类:
被多次调用的方法。
被多次执行的循环体。
判断一段代码是不是热点代码,是不是需要触发即时编译,这样的行为称为热点探测(Hot Spot Detection),进行热点探测并不一定要知道具体被调用了多少次,目前主要的热点探测判定方式有两种:
基于采样的热点探测(Sample Based Hot Spot Detection):采用这种方法的虚拟机会周期性地检查各个线程的栈顶,如果发现某个(或某些)方法经常出现在栈顶,那这个方法就是“热点方法”。基于采样的热点探测的好处是实现简单、高效,还可以很容易地获取方法调用关系(将调用堆栈展开即可),缺点是很难精确地确认一个方法的热度,容易因为受到线程阻塞或别的外界因素的影响而扰乱热点探测。
基于计数的热点探测(Counter Based Hot Spot Detection):采用这种方法的虚拟机会为每个方法(甚至代码块)建立计数器,统计方法的执行次数,如果执行次数超过一定的阈值就认为它是“热点方法”。这种统计方法实现起来麻烦,需要为每个方法维护计数器,而且不能直接获取到方法的调用关系,但是它的统计结果相对精确。
Hotspot虚拟机使用第二种。
编译过程
查看及分析即使编译结果
编译优化技术