String的使用

String的基本特性

  • String:字符串,使用- -对""引起来表示。

  • String声明为final的,不可被继承

  • String实现了Serializable接口:表示字符串是支持序列化的。
       实现了Comparable接口:表示String可以比较大小

  • String在jdk8及以前内部定义了final char[] value用 于存储字符串数据。jdk9时改为byte[]。基于String的相关类也做了一定的修改:AbstractStringBuilder、StringBuffer等
    jdk8:
    String的使用jdk9:
    String的使用问题:为什么改用byte[]数组?
    更多的时候,String对象里面保存的字符使用一个byte就可以保存。如果使用char[]进行存储,就造成了空间浪费。改用byte[]后,对于需要占用两个byte的字符如何存储?使用2个byte进行存储,并且为这些字符加上一个字符编码标识。

  • String:代表不可变的字符序列。简称:不可变性。
    ➢当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值。
    ➢当对现有的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
    ➢当调用String的replace ()方法修改指定字符或字符串时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。

  • 通过字面量的方式(区别于new)给一个字符串赋值,此时的字符串值声明在字符串常量池中。

  • 字符串常量池中是不会存储相同内容的字符串的。
    ➢String的String Pool是一 个固定大小的Hashtable,默认值大小长度是1009。如果放进String Pool的String非常多, 就会造成Hash冲突严重,从而导致链表会很长,而链表长了后直接会造成的影响就是当调用String. intern时性能会大幅下降。
    ➢使用-XX: StringTableSi ze可设置StringTable的长度
    ➢在jdk6中StringTable是固定的,就是1009的长度,所以如果常量池中的字符串过多就会导致效率下降很快。StringTableSize 设置没有要求
    ➢在jdk7中,StringTable的长度默认值是60013。jdk8开始,1009是可设置的最小值。

String的内存分配

  • 在Java语言中有8种基本数据类型和一种比较特殊的类型String。这些类型为了使它们在运行过程中速度更快、更节省内存,都提供了一种常量池的概念。
  • 常量池就类似一个Java系统级别提供的缓存。8种基本数据类型的常量池都是系统协调的,String类型的常量池比较特殊,它的主要使用方法有两种:
    ➢直接使用双引号声明出来的String对象会直接存储在常量池中。
    比如:String info = “atguigu. com”;
    ➢如果不是用双引号声明的String对象,可以使用String提供的intern()方法。
  • Java 6及以前,字符串常量池存放在永久代。
  • Java 7中Oracle的工程师对字符串池的逻辑做了很大的改变,即将字符串常量池的位置调整到Java堆内。
    ➢所有的字符串都保存在堆(Heap)中,和其他普通对象一样,这样可以让你在进行调优应用时仅需要调整堆大小就可以了。
    ➢字符串常量池概念原本使用得比较多,但是这个改动使得我们有足够的理由让我们重新考虑在Java 7中使用String. intern()
  • Java8将永久代改为元空间,字符串常量仍在堆中。

问题:字符串常量池为什么要调整?
①永久代空间默认比较小 ②永久代垃圾回收频率低

字符串拼接操作

1.常量与常量的拼接结果在常量池,原理是编译期优化
源码:

  @Test
   public void test01(){
       String s1="abc";
       String s2="a"+"b"+"c";
       System.out.println(s1 == s2);//true
   }

反编译后:

  @Test
    public void test01() {
        String s1 = "abc";
        String s2 = "abc";//此处做了优化
        System.out.println(s1 == s2);
    }

2.常量池中不会存在相同内容的常量。
3.只要其中有一个是变量,结果就在堆中,新创建了一个对象。变量拼接的原理是StringBuilder
4.如果拼接的结果调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回此对象地址。
源码:

   @Test
   public  void test2(){
        String s1="javaEE";
        String s2="hadoop";

        String s3="javaEEhadoop";
        String s4="javaEE"+"hadoop";
        String s5=s1+"hadoop";
        String s6="javaEE"+s2;
        String s7=s1+s2;
        System.out.println(s3==s4);//true
        System.out.println(s3==s5);//false
        System.out.println(s3==s6);//false
        System.out.println(s3==s7);//false
        System.out.println(s5==s6);//false
        System.out.println(s5==s7);//false
        System.out.println(s6==s7);//false

        String s8=s6.intern();
        System.out.println(s3==s8);//true
   }

反编译后:

    @Test
    public void test2() {
        String s1 = "javaEE";
        String s2 = "hadoop";
        String s3 = "javaEEhadoop";
        String s4 = "javaEEhadoop";
        String s5 = s1 + "hadoop";
        String s6 = "javaEE" + s2;
        String s7 = s1 + s2;
        System.out.println(s3 == s4);
        System.out.println(s3 == s5);
        System.out.println(s3 == s6);
        System.out.println(s3 == s7);
        System.out.println(s5 == s6);
        System.out.println(s5 == s7);
        System.out.println(s6 == s7);
        String s8 = s6.intern();
        System.out.println(s3 == s8);
    }

字符串拼接操作底层原理:
源码:

 @Test
   public void test3(){
        String s1="a";
        String s2="b";
        String s3="ab";
        String s4=s1+s2;
       System.out.println(s3 == s4);//false
   }

字节码指令:

 0 ldc #13 <a>
 2 astore_1
 3 ldc #14 <b>
 5 astore_2
 6 ldc #15 <ab>
 8 astore_3
 9 new #8 <java/lang/StringBuilder>r
12 dup
13 invokespecial #9 <java/lang/StringBuilder.<init>>
16 aload_1
17 invokevirtual #10 <java/lang/StringBuilder.append>
20 aload_2
21 invokevirtual #10 <java/lang/StringBuilder.append>
24 invokevirtual #11 <java/lang/StringBuilder.toString>
27 astore 4
29 getstatic #3 <java/lang/System.out>
32 aload_3
33 aload 4
35 if_acmpne 42 (+7)
38 iconst_1
39 goto 43 (+4)
42 iconst_0
43 invokevirtual #4 <java/io/PrintStream.println>
46 return

String s4=s1+s2;执行细节类比:

StringBuilder s=new StringBuilder();
s.append("a");
s.append("b");
s4=s.toString();——>类似于new String("ab");具体见intern()
//StringBuilder的toString()源码:
 @Override
    public String toString() {
        // Create a copy, don't share the array
        return new String(value, 0, count);
    }

注意:字符串拼接操作不一定都使用StringBuilder。如果拼接操作符两边都是常量或者常量引用,则会进行编译期优化。

public void test3(){
        final String s1="a";
        final String s2="b";
        String s3="ab";
        String s4=s1+s2;//String s4="ab";
       System.out.println(s3 == s4);//true
   }

从上述代码来看,当“+”两边有变量时,底层会创建一个StringBuilder对象来完成操作,而StringBuilder的toString()方法里又会new一个String对象。
执行效率:使用StringBuilder的append()追加字符串的效率要远高于String的字符串拼接操作。因此,不考虑线程安全的情况下,程序中若经常进行字符串拼接的尽量使用StringBuilder。优化:创建StringBuilder时指定足够的数组长度(默认16,扩容比例:(value.length << 1) + 2)

上一篇:2192:Zipper DP+DFS


下一篇:牛客网代码练习