String的intern方法的使用场景

在讲intern方法前,我们先简单回顾下Java中常量池的分类。

常量池的分类

Java中常量池可以分为Class常量池、运行时常量池和字符串常量池

1. Class文件常量池

在Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用。

所谓字面量类似与我们平常说的常量,主要包括以下两种

  • 文本字符串,例如String a = "aa"。其中"aa"就是字面量。
  • 被final修饰的变量。

符号引用包括以下形式:

  • 类和接口和全限定名:例如对于String这个类,它的全限定名就是java/lang/String。
  • 字段的名称和描述符:所谓字段就是类或者接口中声明的变量,包括类级别变量和实例级的变量。
  • 方法的名称和描述符:所谓描述符就相当于方法的参数类型+返回值类型。

2. 运行时常量池

我们知道类加载器会加载对应的Class文件,上面介绍的Class文件常量池中的数据,会在类加载后进入方法区中的运行时常量池。运行时常量池是全局共享的,多个类共用一个运行时常量池。运行时常量池存在于方法区中。

3. 字符串常量池

看名字我们就可以知道字符串常量池是用来存放字符串的,也就是说Class文件常量池中的文本字符串会在类加载时进入字符串常量池。

字符串常量池运行时常量池是什么关系呢?上面我们说Class文件常量池中的字面量会在类加载后进入运行时常量池,其中字面量中也包括文本字符串,从这段文字我们可以知道字符串常量池存在于运行时常量池中,也就存在于方法区中。

但是到了JDK1.7时,字符串常量池被移出了方法区,转移到了堆里了。另外需要我们重点注意的是:字符串常量池中存放的并不是字符串本身,而是字符串对象的引用。

程序运行时,除非手动向常量池中添加常量(比如调用intern方法),否则jvm不会自动添加常量到常量池。

String 的 intern 方法

String 方法的作用是:判断字符串常量池中是否存在一个引用,这个引用指向的字符串对象和当前对象相等(使用 equals 方法判断相等),如果存在直接返回这个引用,如果不存在则创建一个字符串对象并将其引用存入字符串常量池。

下面举个列子帮助加深理解。

//代码基于JDK 8

//s1指向字符串常量池中的"*之路"
String s1 = "*之路";
//s2也指向字符串常量池中的"*之路"
String s2 = "*之路";
//s3指向堆中的某个对象
String s3 = new String("*之路");
//因为字符串常量池中已经存在"*之路"的引用,直接返回这个引用
String s4 = s3.intern(); //创建一个字符串对象
String s5 = new String("ddd");
//常量池中不存在指向"ddd"的引用,创建一个"ddd"对象,并将其引用存入常量池
String s6 = s5.intern();
//创建一个字符串对象
String s7 = new String("ddd");
//常量池中存在指向"ddd"的引用,直接返回
String s8 = s7.intern(); System.out.println("s1==s2:"+(s1==s2));
System.out.println("s1==s3:"+(s1==s3));
System.out.println("s1==s4:"+(s1==s4)); System.out.println("s5==s6:"+(s5==s6));
System.out.println("s6==s8:"+(s6==s8));
System.out.println("s7==s8:"+(s7==s8));

返回的结果如下:

s1==s2:true
s1==s2:false
s1==s2:true
s5==s6:false
s6==s8:true
s7==s8:false

intern 方法使用场景

我们来看下面这个方法。

public class Person{
String name;
public void setName(String name)
{
this.name = name
}
}

假如现在的Person对象都叫小明,那么这些Person对象都会引用一个不同的字符串对象。

String的intern方法的使用场景

如果我们改进下这个方法:

public class Person{
String name;
public void setName(String name)
{
this.name = name.intern();
}
}

那么对象的引用结构如下图所示:

String的intern方法的使用场景

这样明显可以节省多个字符串对象的空间。我写了一个测试程序:

public class JavaTest {

    public static void main(String[] args) throws Exception {
//一个很大的字符串
String s = "c...c";
List<Person> personList = new ArrayList<>(); int count = 100000;
for (int i = 0; i < count; i++) {
Person p = new Person();
p.setName(new String(s));
//防止垃圾回收
personList.add(p);
System.out.println(i);
}
System.out.println("success...");
} public static class Person{
private String name;
public void setName(String name) {
this.name = name;
}
} }

为了让程序快速将内存耗尽,我这边将内存设置成5M。

-Xms5m -Xmx5m

结果如下:

...
93889
93890
Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded
at com.csx.demo.spring.boot.util.JavaTest.main(JavaTest.java:15)

创建9w多个对象时已经报OutOfMemoryError错误了。

下面调整下 Person 的 set 方法,再执行下。

public static class Person{
private String name;
public void setName(String name) {
this.name = name.intern();
}
}
99997
99998
99999
success...

顺利执行完成。

上一篇:hdu 3915 高斯消元


下一篇:docker简单介绍----docker仓库的应用