String的基本特性
-
String:字符串,使用- -对""引起来表示。
-
String声明为final的,不可被继承
-
String实现了Serializable接口:表示字符串是支持序列化的。
实现了Comparable接口:表示String可以比较大小 -
String在jdk8及以前内部定义了final char[] value用 于存储字符串数据。jdk9时改为byte[]。基于String的相关类也做了一定的修改:AbstractStringBuilder、StringBuffer等
jdk8:
jdk9:
问题:为什么改用byte[]数组?
更多的时候,String对象里面保存的字符使用一个byte就可以保存。如果使用char[]进行存储,就造成了空间浪费。改用byte[]后,对于需要占用两个byte的字符如何存储?使用2个byte进行存储,并且为这些字符加上一个字符编码标识。 -
String:代表不可变的字符序列。简称:不可变性。
➢当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值。
➢当对现有的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
➢当调用String的replace ()方法修改指定字符或字符串时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。 -
通过字面量的方式(区别于new)给一个字符串赋值,此时的字符串值声明在字符串常量池中。
-
字符串常量池中是不会存储相同内容的字符串的。
➢String的String Pool是一 个固定大小的Hashtable,默认值大小长度是1009。如果放进String Pool的String非常多, 就会造成Hash冲突严重,从而导致链表会很长,而链表长了后直接会造成的影响就是当调用String. intern时性能会大幅下降。
➢使用-XX: StringTableSi ze可设置StringTable的长度
➢在jdk6中StringTable是固定的,就是1009的长度,所以如果常量池中的字符串过多就会导致效率下降很快。StringTableSize 设置没有要求
➢在jdk7中,StringTable的长度默认值是60013。jdk8开始,1009是可设置的最小值。
String的内存分配
- 在Java语言中有8种基本数据类型和一种比较特殊的类型String。这些类型为了使它们在运行过程中速度更快、更节省内存,都提供了一种常量池的概念。
- 常量池就类似一个Java系统级别提供的缓存。8种基本数据类型的常量池都是系统协调的,String类型的常量池比较特殊,它的主要使用方法有两种:
➢直接使用双引号声明出来的String对象会直接存储在常量池中。
比如:String info = “atguigu. com”;
➢如果不是用双引号声明的String对象,可以使用String提供的intern()方法。 - Java 6及以前,字符串常量池存放在永久代。
- Java 7中Oracle的工程师对字符串池的逻辑做了很大的改变,即将字符串常量池的位置调整到Java堆内。
➢所有的字符串都保存在堆(Heap)中,和其他普通对象一样,这样可以让你在进行调优应用时仅需要调整堆大小就可以了。
➢字符串常量池概念原本使用得比较多,但是这个改动使得我们有足够的理由让我们重新考虑在Java 7中使用String. intern() - Java8将永久代改为元空间,字符串常量仍在堆中。
问题:字符串常量池为什么要调整?
①永久代空间默认比较小 ②永久代垃圾回收频率低
字符串拼接操作
1.常量与常量的拼接结果在常量池,原理是编译期优化
源码:
@Test
public void test01(){
String s1="abc";
String s2="a"+"b"+"c";
System.out.println(s1 == s2);//true
}
反编译后:
@Test
public void test01() {
String s1 = "abc";
String s2 = "abc";//此处做了优化
System.out.println(s1 == s2);
}
2.常量池中不会存在相同内容的常量。
3.只要其中有一个是变量,结果就在堆中,新创建了一个对象。变量拼接的原理是StringBuilder
4.如果拼接的结果调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回此对象地址。
源码:
@Test
public void test2(){
String s1="javaEE";
String s2="hadoop";
String s3="javaEEhadoop";
String s4="javaEE"+"hadoop";
String s5=s1+"hadoop";
String s6="javaEE"+s2;
String s7=s1+s2;
System.out.println(s3==s4);//true
System.out.println(s3==s5);//false
System.out.println(s3==s6);//false
System.out.println(s3==s7);//false
System.out.println(s5==s6);//false
System.out.println(s5==s7);//false
System.out.println(s6==s7);//false
String s8=s6.intern();
System.out.println(s3==s8);//true
}
反编译后:
@Test
public void test2() {
String s1 = "javaEE";
String s2 = "hadoop";
String s3 = "javaEEhadoop";
String s4 = "javaEEhadoop";
String s5 = s1 + "hadoop";
String s6 = "javaEE" + s2;
String s7 = s1 + s2;
System.out.println(s3 == s4);
System.out.println(s3 == s5);
System.out.println(s3 == s6);
System.out.println(s3 == s7);
System.out.println(s5 == s6);
System.out.println(s5 == s7);
System.out.println(s6 == s7);
String s8 = s6.intern();
System.out.println(s3 == s8);
}
字符串拼接操作底层原理:
源码:
@Test
public void test3(){
String s1="a";
String s2="b";
String s3="ab";
String s4=s1+s2;
System.out.println(s3 == s4);//false
}
字节码指令:
0 ldc #13 <a>
2 astore_1
3 ldc #14 <b>
5 astore_2
6 ldc #15 <ab>
8 astore_3
9 new #8 <java/lang/StringBuilder>r
12 dup
13 invokespecial #9 <java/lang/StringBuilder.<init>>
16 aload_1
17 invokevirtual #10 <java/lang/StringBuilder.append>
20 aload_2
21 invokevirtual #10 <java/lang/StringBuilder.append>
24 invokevirtual #11 <java/lang/StringBuilder.toString>
27 astore 4
29 getstatic #3 <java/lang/System.out>
32 aload_3
33 aload 4
35 if_acmpne 42 (+7)
38 iconst_1
39 goto 43 (+4)
42 iconst_0
43 invokevirtual #4 <java/io/PrintStream.println>
46 return
String s4=s1+s2;执行细节类比:
StringBuilder s=new StringBuilder();
s.append("a");
s.append("b");
s4=s.toString();——>类似于new String("ab");具体见intern()
//StringBuilder的toString()源码:
@Override
public String toString() {
// Create a copy, don't share the array
return new String(value, 0, count);
}
注意:字符串拼接操作不一定都使用StringBuilder。如果拼接操作符两边都是常量或者常量引用,则会进行编译期优化。
public void test3(){
final String s1="a";
final String s2="b";
String s3="ab";
String s4=s1+s2;//String s4="ab";
System.out.println(s3 == s4);//true
}
从上述代码来看,当“+”两边有变量时,底层会创建一个StringBuilder对象来完成操作,而StringBuilder的toString()方法里又会new一个String对象。
执行效率:使用StringBuilder的append()追加字符串的效率要远高于String的字符串拼接操作。因此,不考虑线程安全的情况下,程序中若经常进行字符串拼接的尽量使用StringBuilder。优化:创建StringBuilder时指定足够的数组长度(默认16,扩容比例:(value.length << 1) + 2)