1. 概述
字节码文件是Java虚拟机跨平台/跨语言的基础.
Java虚拟机只与字节码文件绑定,至于字节码文件的源代码是否是Java代码编写就不是JVM考虑的问题了,这也是JVM的强大之处.
字节码的生成由前端编译器生成,前端编译器可以是多种语言的编译器,将源代码编译为符合JVM规范的class文件,交由JVM解释执行.
以Java为例,jdk中就包含了可以编译java源码的编译器,我们可以使用javac来将一个java源代码文件编译为class文件.
而通过对class文件的详细了解,我们可以看到源代码中无法表现的一些细节,编译器是如何对源代码进行优化编译的.
字节码文件是二进制文件.
字节码文件由 操作码和操作数组成. 例如 bipush 20 前面的就是操作码,20就是操作数,操作数可以没有
2. 前端编译器
2.1 javac
javac就是一种前端编译器,也是我们使用最多的编译器,目前在idea里默认的编译器就是javac
javac是一种全量编译器,就是不管java源代码改了多少,都是全量编译.
2.2 ECJ
Eclipse提供了一种区别于javac的编译器给,叫ECJ(Eclipse Compiler For Java),属于Eclipse的插件,他是一个增量的编译器,所以速度要比javac快,而且质量不差多少
2.3 AJC
AspectJ Compiler 可以作为idea的一个插件与javac配合使用,提高编译效率
3. 学习查看字节码的优点
通过几个例子的字节码查看,理解字节码的好处.
3.1 例一
先来一个例子:
public class ClassTest { public static void main(String[] args) { Integer i1 = 10; int i2 = 10; System.out.println(i1 == i2); } }
结果为true,为什么呢?
我们来看一下字节码,就很清楚了:
通过第二行我们可以看到 i1的定义本质上是一个Integer.valueOf方法,我们进入该方法看一下:
public static Integer valueOf(int i) { if (i >= IntegerCache.low && i <= IntegerCache.high) return IntegerCache.cache[i + (-IntegerCache.low)]; return new Integer(i); } // 进入cache方法 静态内部类 private static class IntegerCache { static final int low = -128; static final int high; static final Integer cache[]; static { // high value may be configured by property int h = 127; String integerCacheHighPropValue = sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high"); if (integerCacheHighPropValue != null) { try { int i = parseInt(integerCacheHighPropValue); i = Math.max(i, 127); // Maximum array size is Integer.MAX_VALUE h = Math.min(i, Integer.MAX_VALUE - (-low) -1); } catch( NumberFormatException nfe) { // If the property cannot be parsed into an int, ignore it. } } high = h; cache = new Integer[(high - low) + 1]; int j = low; for(int k = 0; k < cache.length; k++) cache[k] = new Integer(j++); // range [-128, 127] must be interned (JLS7 5.1.7) assert IntegerCache.high >= 127; } private IntegerCache() {} }
可以看到是一个IntegerCache在获取了值 (int为10 不超过low的值-128 high的值127); IntegerCache对-128到127这256个数字做了缓存,所以取到的数字10本质上就是int 10
所以输出为true
3.2 例二
字符串拼接里在从jvm查看字符串
package com.zy.study15; /** * @Author: Zy * @Date: 2022/2/7 15:45 * 字节码查看字符串拼接 */ public class ClassTest { public static void main(String[] args) { // 其实是StringBuilder的拼接 生成的是一个新的String对象 String helloWorld = new String("hello") + new String("world"); // 字符串常量池 String helloWorld1 = "helloworld"; // 不相等 false System.out.println(helloWorld == helloWorld1); // 也是新创建的对象 String helloworld2 = new String("helloworld"); // 不相等 false System.out.println(helloWorld1 == helloworld2); } }
字节码如下:
0 new #2 <java/lang/StringBuilder> 3 dup 4 invokespecial #3 <java/lang/StringBuilder.<init> : ()V> 7 new #4 <java/lang/String> 10 dup 11 ldc #5 <hello> 13 invokespecial #6 <java/lang/String.<init> : (Ljava/lang/String;)V> 16 invokevirtual #7 <java/lang/StringBuilder.append : (Ljava/lang/String;)Ljava/lang/StringBuilder;> 19 new #4 <java/lang/String> 22 dup 23 ldc #8 <world> 25 invokespecial #6 <java/lang/String.<init> : (Ljava/lang/String;)V> 28 invokevirtual #7 <java/lang/StringBuilder.append : (Ljava/lang/String;)Ljava/lang/StringBuilder;> 31 invokevirtual #9 <java/lang/StringBuilder.toString : ()Ljava/lang/String;> 34 astore_1 35 ldc #10 <helloworld> 37 astore_2 38 getstatic #11 <java/lang/System.out : Ljava/io/PrintStream;> 41 aload_1 42 aload_2 43 if_acmpne 50 (+7) 46 iconst_1 47 goto 51 (+4) 50 iconst_0 51 invokevirtual #12 <java/io/PrintStream.println : (Z)V> 54 new #4 <java/lang/String> 57 dup 58 ldc #10 <helloworld> 60 invokespecial #6 <java/lang/String.<init> : (Ljava/lang/String;)V> 63 astore_3 64 getstatic #11 <java/lang/System.out : Ljava/io/PrintStream;> 67 aload_2 68 aload_3 69 if_acmpne 76 (+7) 72 iconst_1 73 goto 77 (+4) 76 iconst_0 77 invokevirtual #12 <java/io/PrintStream.println : (Z)V> 80 return
从字节码里你就可以看到多个String对象相加是怎么操作了,创建的StringBuilder对象进行append操作,最后调用toString方法
3.3 例三
package com.zy.study15; /** * @Author: Zy * @Date: 2022/2/9 18:44 * 父子类从字节码看 */ public class ClassTest2 { static class Father{ int num = 0; void print(){ System.out.println("Father打印,num的值为"+num); } Father(){ print(); num = 20; } } static class Son extends Father{ int num = 100; void print(){ System.out.println("Son打印,num的值为"+num); } Son(){ print(); num = 200; } } public static void main(String[] args) { // 多态 父类子类的构造器里都有打印,那么打印num的结果是什么,为什么 Father father = new Son(); System.out.println(father.num); } }
打印结果
解释这个结果只需要看下字节码就可以了
new Son()本质上就是调用了构造器,所以我们看下构造器的方法
3.3.1 Father类init字节码
0 aload_0 this对象 1 invokespecial #10 <java/lang/Object.<init> : ()V> 父类Object的构造方法 4 aload_0 5 iconst_0 常量0 也就是num的默认值 6 putfield #6 <com/zy/study15/ClassTest2$Father.num : I> 给num赋默认初始值0 9 aload_0 10 invokevirtual #11 <com/zy/study15/ClassTest2$Father.print : ()V> 调用Print方法,打印num 13 aload_0 14 bipush 20 构造方法中的给num赋值20,这里是取出常量20 16 putfield #6 <com/zy/study15/ClassTest2$Father.num : I> 给num赋值20 19 return
3.3.2 Son类init字节码
0 aload_0 1 invokespecial #10 <com/zy/study15/Father.<init> : ()V> 同理,父类Father的构造方法 4 aload_0 5 bipush 100 取出100 7 putfield #6 <com/zy/study15/Son.num : I> 给num赋100 10 aload_0 11 invokevirtual #11 <com/zy/study15/Son.print : ()V> Print打印方法,打印num 14 aload_0 15 sipush 200 取出常量200 18 putfield #6 <com/zy/study15/Son.num : I> 给num赋值200 21 return
解释下:
- new Son()会先调用Son类的构造方法,具体执行过程可以看上面的Son类的init字节码
- 从Son的init构造方法的执行过程中可以看到,在第二行调用父类Father的构造方法.
- 这个时候再去调用Father的构造方法
- 可以看到在打印num的时候,只给num赋了初始值0,所以第一次打印的值为0
- 并且由于多态,Print方法被子类Son重写,所以打印的内容里是Son打印,而不是Father打印
- 执行完父类的构造方法后,继续回到Son类的init方法
- 可以看到打印num之前给num赋了100,所以打印num的值是100
- 再之后给num赋了200,所以再获取Son的num的值就是200了.
- 最后一行的输出为20,这是因为我们获取的是Father的num值,而不是Son的num的值.
3.3 总结
通过字节码可以看到一些不容易理解的代码的执行过程.
4. 查看字节码文件的方法
4.1 第三方软件
安装Binary Viewer工具,可以打开字节码文件
Binary Viewer安装包 https://www.aliyundrive.com/s/5HCJfAFQoxf 提取码0eo6
或者Notepad++插件 Hex-Editor
直接在插件市场安装即可(如果插件市场有问题,尝试安装最新版本notepad++)
4.2 jdk自带javap
# 将class文件反编译后的内容输出到当前目录
javap -v ClassTest.class > ClassTestOut.java
4.3 idea插件 jclasslib
idea插件市场安装 jclasslib即可
效果如下: