深入了解jvm-2Edition-虚拟机字节码执行引擎

2023-12-10 18:16:51

1、概述

　　Java虚拟机规范制定了虚拟机字节码执行引擎的概念模型，本章主要从概念模型层次来探究虚拟机的方法调用和字节码执行。

　　方法调用中，最核心的，是如何确定调用的方法，也就是方法的分派。

　　字节码执行过程中，特别重要的一点是执行上下文的切换和信息的交换处理。这需要运行时数据结构的支持，也就是运行时栈帧。

2、运行时栈帧结构

　　运行时栈帧（Stack Frame）是用于支持虚拟机方法调用和方法执行的数据结构。

　　它是虚拟机运行时数据区中的虚拟机栈的栈元素。

　　存储了方法的局部变量表、操作数栈、动态链接和方法返回地址等信息。

　　方法的调用、执行、返回过程就是栈帧在栈里入栈（创建）、内部信息改变、出栈（销毁）的过程。

　　在编译过程中，栈帧中的局部变量表的大小、操作数栈的深度就已经确定并记录在了方法的code属性里面了。

　　对于执行引擎来说，只有栈顶的栈帧（当前栈帧，对应当前方法）是有效的。

　　1、局部变量表

　　　　存放方法参数和方法内部定义的局部变量。

　　　　容量以槽（Slot）为最小单位。

　　　　虚拟机规范没有规定槽的大小，

　　　　只说了每个槽都能存放一个boolean、byte、char、short、int、float、reference、或 returnAddress数据类型。

　　　　因此可以说一个Slot可以存放一个32位及以下的数据类型。

　　　　64位的数据类型要占用两个Slot（long、double），高位对齐。

　　　　reference数据至少要能帮助虚拟机完成两项功能：

　　　　　　1、直接或间接地查找到对象在Java堆中的起始地址；

　　　　　　2、直接或间接地在方法区中查找到对象所属数据类型（对象的元数据）。

　　　　局部变量列表中，索引从0开始，第0位存放的是方法隐含的参数this（非static方法）。

　　　　其余位置先按参数列表的顺序存放参数，再按局部变量定义的顺序存放局部变量。

　　　　局部变量表中的引用会影响到GC的行为，因为它是GC Roots之一。

　　　　如果局部变量表中的引用还存在，那么GC就不会清除引用指向的对象。

　　　　将对象引用置为null来帮助GC的原理就是手动将局部变量表中对应的的Slot清空。

　　　　置null操作意义不大，这通常会被编译器优化掉。。。

　　　　最重要的一点！局部变量表不像方法区中的类一样有初始化赋值过程（准备阶段），

　　　　因此，没有赋初始值的局部变量是不能使用的。不像类变量一样有系统初始值。

　　2、操作数栈

　　　　操作数栈是方法执行的最基础的支撑。

　　　　操作数栈中元素的数据类型要与字节码指令严格匹配，这在编译时会保证，在类校验阶段还要再次验证。

　　3、动态链接

　　　　指向方法区中运行时常量池中该栈帧所属方法的引用，为了支持方法调用过程中的动态链接。

　　　　静态解析：在类加载或第一次使用的时候就将符号引用转换为直接引用。

　　　　动态链接：在运行期间才转转为直接引用。

　　4、方法返回地址

　　　　正常完成出口：方法正常执行退出

　　　　异常完成出口：。。。

　　　　方法退出过程就是将当前栈帧出栈，并恢复上层方法的局部变量表和操作数栈，

　　　　把返回值压入上层方法的操作数栈中，调整PC的值，指向下一条指令。

　　5、附加信息

　　　　调试信息等。

3、方法调用

　　方法调用不等同于执行，调用只是确定是哪一个方法（参数、返回值、所属类）。

　　1、解析

　　　　调用目标在编译期就确定，这就是解析调用。

　　　　方法能解析的前提：方法在程序运行前就有一个可确定的调用版本，并且该版本在运行期不变。

　　　　符合该前提的方法主要包括静态方法和私有方法。

　　　　静态方法直接和类关联，私有方法不可访问，因此它们都不可通过继承或其他方式重写。

　　　　虚拟机中的方法调用指令：

　　　　　　1、invokespecial：调用构造器<init>，私有方法和父类方法。

　　　　　　2、invokestatic：调用静态方法。

　　　　　　3、invokevritual：调用虚方法

　　　　　　4、invokeinterface：调用接口方法

　　　　　　5、invokedynamic：动态解析调用方法。

　　　只要能够被1、2调用的方法都可以在解析时确定。

4、方法调用-分派

　　解析调用在编译期完成，是静态的。

　　分派则可以是静态的也可以是动态的。

　　按照宗量数又可分为单分派和多分派。（方法接收者与参数统称为方法宗量）

　　因此，就可组合出：动/静态单/多分派 四种分派方式。

　　静态分派是重载的虚拟机层面的实现。动态分派是重写的虚拟机层面的实现。

　　1、静态分派

　　　　　　Human man = new Man();

　　　　其中，Human称为变量的静态类型（Apparent Type），Man称为变更量的实际类型（Actual Type）。

　　　　静态类型在编译时就可以确定，但是实际类型要在运行时才能确定。

　　　　其实，从英文名就很好理解，Apparent Type就是表面上的类型，Actual Type就是实际上的类型。

　　　　对于man，在编译时就可以确定它是一个Human类型，但是，他到底是Man还是Woman要等程序运行时才知道。

　　　　方法被重载时，是通过静态类型作为方法的选择依据的，因此在编译时就可以选定重载方法。

　　　　依据静态类型来定位方法的执行版本的分派就称为静态分派。

　　　　所以，静态分派不是虚拟机做的，它是编译期做的。

　　2、动态分派

　　　既然静态分派是在编译期，那么动态分派就在运行期咯。

　　　　　　void sayHello(Human human){ human.hello(); }

　　　　　　sayHello(man);

　　　　　　sayHello(woman);

　　　　对于上述代码，怎么去确定human.hello()要调用的方法呢？

　　　　javap 反编译后，发现它们都是由invokevirtual调用的，但是，两个invokevirtual都是指向的Human的hello()。

　　　　但是两个执行的方法明显是不同的。

　　　　这就是因为invokevirtual指令的多态查找过程：

　　　　　　1、找到操作数栈栈顶的元素指向的对象的实际类型，记为C。

　　　　　　　　都找到实际类型了，多态不就解决了。

　　　　　　2、在C中查找与invokevirtual指令参数常量描述符和简单名都相符的方法，

　　　　　　　　找到后，要检查访问权限，权限不通过，则抛出IllegalAccessError异常。

　　　　　　3、否则，到继承链上寻找。

　　　　　　4、否则，抛出AbstractMethodError异常。

　　　　可以看出，invokevirtual指令的执行结果是和操作数栈的状态相关的，

　　　　还可以看出，调用对象方法时，首先要做的，就是将对象引用入栈。

　　　　因此就多态就实现了。

　　3、单分派和多分派

　　　　方法的接收者与方法的参数统称为方法的宗量。根据分派基于多少宗量，可以将分派划分为单分派和多分派。

　　　　上面代码中，对 father.Chioce(new Candy())；处代码编译期选择依据两点：

　　　　　　注意father的类型是可编译时确定的。因此为静态分派。

　　　　　　1、静态类型是Father还是Son；

　　　　　　2、方法参数是Candy还是Fist。

　　　　　　基于两个宗量进行的，因此静态分派属于多分派类型。

　　　　对son.Choice(new Candy()); 处调用：

　　　　　 son的类型在编译期无法确定，因此为动态分派。

　　　　　但是，此时编译器已经指定了方法的参数必须是Candy类型的。

　　　　　因此，动态分派时只需要确定方法的所属类。

　　　　　因此，Java的动态分派属于单分派类型。

　　　　Java是静态多分派，动态单分派的类型。

　　4、虚拟机动态分派实现

　　　　出于性能考虑，在实现中，为类在方法区中建立了一个虚方法表（Virtual Method Table），

　　　　用于invokevirtual指令执行时，直接在该虚方法表中查找方法。

　　　　虚方法表中存放着各个方法的实际入口地址，

　　　　如果子类没有重写父类方法，那么子类的虚方法表中，该方法指向父类方法的实现入口。　

　　　　如果子类重写了，就指向子类自己的实现的入口。

　　　　为了实现方便，相同签名的方法在子类和父类虚方法表中的索引都一样。

　　　　虚方法表一般在类加载的链接阶段初始化，就是在类第一次初始化之后。

　　　　为了invokeinterface执行，也建立了接口方法表（Interface Method Table）。

5、动态类型语言支持

　　动态类型语言可以实现在运行时*地为类绑定字段和方法，这就要求，在进行方法分派时，可以有自己的选择。

　　但是目前讲到的分派，方法分派时的查找都是规定好了的。

　　因此，要支持动态类型支持，就要将方法分派的接口分享出来，让我们可以自己去进行分派。

　　jdk1.7引入了java.lang.invoke包，提供了一种新的动态确定目标方法的机制：

　　MethodHandle

　　　　A method handle is a typed, directly executable reference to an underlying method, constructor, field,

　　　　or similar low-level operation, with optional transformations of arguments or return values.

　　也就是说，除了只能把类作为单独实体来使用，我们可以通过MethodHandle将方法也抽象成一个单独实体。

　　（虽然也是通过类来实现的。。。）

　　好了，我们现在能单独使用方法了，但是，还得找到它吧。

　　这就涉及到怎么确定一个方法：

　　　　1、方法所属类

　　　　2、方法简单名

　　　　3、方法描述符（参数，返回值）

　　MethodType

　　　　A method type represents the arguments and return type accepted and returned by a method handle,

　　　　or the arguments and return type passed and expected by a method handle caller.

　　MethodType封装了对方法描述符的表示。

　　现在：

　　　　1、类可以用类的Class对象表示；

　　　　2、方法简单名——字符串

　　　　3、方法描述符——MethodType

　　就可以去找方法了。

　　MethodHandles类为我们提供了许多根据上述标识找方法的封装。太贴心了。

　　invokedynamic指令：

　　　　同MethodHandle机制一样，只是MethodHandle是上层实现，invokedynamic是底层实现。

　　　　每一处invokedynamic指令的位置都被称作动态调用点（Dynamic Call Site）。

　　　　CallSite：

　　　　　　A CallSite is a holder for a variable MethodHandle, which is called its target.

　　　　　　An invokedynamic instruction linked to a CallSite delegates all calls to the site‘s current target.

　　　　invokedynamic指令的第一个参数不是CONSTANT_Methodref_info常量，

　　　　而是新增的CONSTANT_InvokeDynamic_info。

　　　　CONSTANT_InvokeDynamic_info包含三个信息：

　　　　　　1、引导方法；

　　　　　　2、方法类型MethodType

　　　　　　3、方法名称

　　　　　　根据前面分析，方法名称、描述符有了，但是还差方法所属类。所以，引导方法中，应该要提供查找类！

　　　　引导方法（Bootstrap Method）：

　　　　　　存放在BootstrapMethods属性中，是有固定参数，并且返回值是java.lang.invoke.CallSite对象的方法。

　　　　　　代表真正要执行的目标方法调用。

　　　　根据CONSTANT_InvokeDynamic_info中的信息，虚拟机找到并执行引导方法，得到一个CallSite对象，

　　　　最终使用CallSite调用目标方法。

　　　　现在有了方法的标识，谁去帮我们找呢？

　　　　MethodHandles.Lookup lookup() ：

　　　　　　Returns a Lookup object with full capabilities to emulate all supported bytecode behaviors of the caller.

　　　　　　Lookup对象可以模拟调用的字节码行为。就是它了。

6、　基于栈的字节码解释执行引擎

　　主要注意，基于操作数栈，数据交换都要经过操作数栈。指令也是针对栈元素进行操作的。

深入了解jvm-2Edition-虚拟机字节码执行引擎

码农公寓

1、概述

2、运行时栈帧结构

1、局部变量表

2、操作数栈

3、动态链接

4、方法返回地址

5、附加信息

3、方法调用

1、解析

4、方法调用-分派

1、静态分派

2、动态分派

3、单分派和多分派

4、虚拟机动态分派实现

5、动态类型语言支持

6、 基于栈的字节码解释执行引擎

相关文章

　　1、局部变量表

　　2、操作数栈

　　3、动态链接

　　4、方法返回地址

　　5、附加信息

　　1、解析

　　1、静态分派

　　2、动态分派

　　3、单分派和多分派

　　4、虚拟机动态分派实现

6、　基于栈的字节码解释执行引擎