四:Java之字符串操作String、StringBuffer和StringBuilder

2022-09-05 13:42:51

string是我们经常用到的一个类型，其实有时候觉得写程序就是在反复的操作字符串，这是C的特点，在java中，jdk很好的封装了关于字符串的操作。三个类String 、StringBuffer 、 StringBuilder .这三个类基本上满足了我们在不同情景下使用字符串的需求。

一、String

JDK的解释是 “Strings are constant; their valuescannot be changed after they are created”也就是说String对象一旦被创建就是固定不变的了，这样的一点好处就是可以多线程之间访问，因为只读不写。

一般情况下我们以下面两种方式创建一个String对象

Stringstr1 = “Liangcs”;

Stringstr2 = new String(“Laingcs”);

两种方式是有区别的，这和java的内存管理有关，前面已经说过，string创建之后是不可变的，所以按照第一种方式创建的字符串会放在栈里，更确切的是常量池中，常量池就是用来保存在编译阶段确定好了大小的数据，一般我们定义的int等基本数据类型就保存在这里。

其具体的一个流程就是，编译器首先检查常量池，看看有没有一个“string”，如果没有则创建。如果有的话，则则直接把str1指向那个位置。

第二种创建字符串的方法是通过new关键字，还是java的内存分配，java会将new的对象放在堆中，这一部分对象是在运行时创建的对象。所以我们每一次new的时候，都会创建不同的对象，即便是堆中已经有了一个一模一样的。

写一个小例子

<span style="font-size:18px;">String str1 = "string";
String str4 = "string";
String str2 = newString("string");
String str3 = newString("string");
       
/*用于测试两种创建字符串方式的区别*/
System.out.println(str1 == str4);
System.out.println(str2 == str3);
System.out.println(str3 == str1);
       
str3 =str3.intern(); //一个不常见的方法
System.out.println(str3 == str1);
这个的运行结果是
true    //解释：两个字符串的内容完全相同，因而指向常量池中的同一个区域
false   //解释：每一次new都会创建一个新的对象
false  // 解释： 注意==比较的是地址，不仅仅是内容 
true //介绍一下intern方法，这个方法会返回一个字符串在常量池中的一个地址，如果常量池中有与str3内容相同的string则返回那个地址，如果没有，则在常量池中       创建一个string后再返回。实际上，str3现在指向了str1的地址。</span>

很多人有这样的疑问就是既然string是不变的，那么为什么str1 + "some"是合法的，其实，每次对string进行修改，都会创建一个新的对象。

所以如果需要对一个字符串不断的修改的话，效率是非常的低的，因为堆的好处是可以动态的增加空间，劣势就是分配新的空间消耗是很大的，比如我们看下面的测试。

<span style="font-size:18px;">        long start =System.currentTimeMillis();
       
        for(int i = 0; i < 50000; i++)
        {
            str1+= " ";
        }    
        long end = System.currentTimeMillis();
        System.out.println("the run timeis "+(end -start)+" ms");</span>

上运行结果是the run time is 3538 ms 如果你把循环的次数后面再增加几个0就会更慢。因为每一次循环都在创建心的对象，那么JDK如何解决这个问题？

下面就要说

二、StringBuffer。

StringBuffer是一个线程安全的，就是多线程访问的可靠保证，最重要的是他是可变的，也就是说我们要操作一个经常变化的字符串，可以使用这个类，基本的方法就是append（与string的concat方法对应）和insert方法，至于怎么使用，就不多讲了，大家可以自己查看API。

<span style="font-size:18px;">       StringBuilder sb = new StringBuilder("string builder");
        StringBuffer sf = newStringBuffer("string buffer");
        long start =System.currentTimeMillis();
        for(int i = 0; i < 50000; i++)
        {
            //str1+= " ";
            sb.append(" ");
        }
        long end = System.currentTimeMillis();
        System.out.println("the run timeis "+(end -start)+" ms");</span>

测试一下，这次只需要8ms，这就是效率。

三、StringBuilder

那么接下来，就要问StringBuilder是干什么的，其实这个才是我们尝使用的，这个就是在jdk 1.5版本后面添加的新的类，前面说StringBuffer是线程同步的，那么很多情况下，我们只是使用一个线程，那个同步势必带来一个效率的问题，StringBuilder就是StringBuffer的非线程同步的版本，二者的方法差不多，只是一个线程安全（适用于多线程）一个没有线程安全（适用于单线程）。

其实看了一下jdk源代码就会发现，StringBuffer就是在各个方法上加上了关键字syncronized

StringBuilder也是一个可变的字符串对象，他与StringBuffer不同之处就在于它是线程不安全的，基于这点，它的速度一般都比StringBuffer快。与StringBuffer一样，StringBuider的主要操作也是append与insert方法。这两个方法都能有效地将给定的数据转换成字符串，然后将该字符串的字符添加或插入到字符串生成器中。

三者比较

简要的说， String 类型和 StringBuffer 类型的主要性能区别其实在于 String 是不可变的对象（为什么？问问 Java 的设计者吧，为什么 String 不是原生类型呢？）因此在每次对 String 类型进行改变的时候其实都等同于生成了一个新的 String 对象，然后将指针指向新的 String 对象，所以经常改变内容的字符串最好不要用 String ，因为每次生成对象都会对系统性能产生影响，特别当内存中无引用对象多了以后， JVM 的 GC 就会开始工作，那速度是一定会相当慢的。这里尝试举个不是很恰当的例子：

<span style="font-size:18px;">       String S1 = “abc”;
       For(int I = 0 ; I < 10000 ; I++)  // For 模拟程序的多次调用
       {
              S1+ = “def”;
              S1= “abc”;
       }</span>

如果是这样的话，到这个 for 循环完毕后，如果内存中的对象没有被 GC 清理掉的话，内存中一共有上万个了，惊人的数目，而如果这是一个很多人使用的系统，这样的数目就不算很多了，所以大家使用的时候一定要小心。

而如果是使用 StringBuffer 类则结果就不一样了，每次结果都会对 StringBuffer 对象本身进行操作，而不是生成新的对象，再改变对象引用。所以在一般情况下我们推荐使用StringBuffer ，特别是字符串对象经常改变的情况下。而在某些特别情况下， String 对象的字符串拼接其实是被 JVM 解释成了 StringBuffer 对象的拼接，所以这些时候 String 对象的速度并不会比 StringBuffer 对象慢，而特别是以下的字符串对象生成中， String 效率是远要比 StringBuffer 快的：

String S1 = “This is only a” + “simple” + “ test”;

StringBuffer Sb = newStringBuilder(“This is only a”).append(“ simple”).append(“ test”);

你会很惊讶的发现，生成 String S1 对象的速度简直太快了，而这个时候 StringBuffer 居然速度上根本一点都不占优势。其实这是 JVM 的一个把戏，在 JVM 眼里，这个

String S1 = “This is only a” + “simple” + “test”; 其实就是：

String S1 = “This is only asimple test”; 所以当然不需要太多的时间了。但大家这里要注意的是，如果你的字符串是来自另外的 String 对象的话，速度就没那么快了，譬如：

String S2 = “This is only a”;

String S3 = “ simple”;

String S4 = “ test”;

String S1 = S2 +S3 + S4;

这时候 JVM 会规规矩矩的按照原来的方式去做， S1 对象的生成速度就不像刚才那么快了，一会儿我们可以来个测试作个验证。

由此我们得到第一步结论：

在大部分情况下 StringBuffer >String

而 StringBuilder 跟他们比又怎么样呢？先简单介绍一下， StringBuilder 是 JDK5.0 中新增加的一个类，它跟 StringBuffer 的区别看下面的介绍（来源 JavaWorld ）：

Java.lang.StringBuffer 线程安全的可变字符序列。类似于 String 的字符串缓冲区，但不能修改。可将字符串缓冲区安全地用于多个线程。可以在必要时对这些方法进行同步，因此任意特定实例上的所有操作就好像是以串行顺序发生的，该顺序与所涉及的每个线程进行的方法调用顺序一致。

每个字符串缓冲区都有一定的容量。只要字符串缓冲区所包含的字符序列的长度没有超出此容量，就无需分配新的内部缓冲区数组。如果内部缓冲区溢出，则此容量自动增大。从 JDK 5.0 开始，为该类增添了一个单个线程使用的等价类，即 StringBuilder 。与该类相比，通常应该优先使用 StringBuilder 类，因为它支持所有相同的操作，但由于它不执行同步，所以速度更快。

但是如果将 StringBuilder 的实例用于多个线程是不安全的。需要这样的同步，则建议使用 StringBuffer 。

这样说估计大家都能明白他们之间的区别了，那么下面我们再做一个一般性推导：

在大部分情况下 StringBuilder >StringBuffer

因此，根据这个不等式的传递定理：在大部分情况下

StringBuilder > StringBuffer> String

对于三者使用的总结：
1.如果要操作少量的数据用 String
2.单线程操作字符串缓冲区下操作大量数据 StringBuilder
3.多线程操作字符串缓冲区下操作大量数据 StringBuffer

四、常用串操作

1、字符串比较

equals() ------判断内容是否相同。

compareTo() ------判断字符串的大小关系。

compareToIgnoreCase(String int) ------在比较时忽略字母大小写。

== ------判断内容与地址是否相同。

equalsIgnoreCase() ------忽略大小写的情况下判断内容是否相同。

reagionMatches() ------对字符串中的部分内容是否相同进行比较（详情请参考API）。

2、字符串查找

charAt(int index) ------返回指定索引index位置上的字符，索引范围从0开始。

indexOf(String str)------从字符串开始检索str，并返回第一次出现的位置，未出现返回-1。

indexOf(String str，intfromIndex);------从字符串的第fromIndex个字符开始检索str。

lastIndexOf(String str)------查找最后一次出现的位置。

lastIndexOf(String str，intfromIndex)----从字符串的第fromIndex个字符查找最后一次出现的位置。

starWith(String prefix，inttoffset)-----测试此字符串从指定索引开始的子字符串是否以指定前缀开始。

starWith(String prefix)------测试此字符串是否以指定的前缀开始。

endsWith(String suffix)------测试此字符串是否以指定的后缀结束。

3、字符串截取

public String subString(int beginIndex)------返回一个新的字符串，它是此字符串的一个子字符串。

public String subString(int beginIndex，int endIndex)------返回的字符串是从beginIndex开始到endIndex-1的串。

4、字符串替换

public String replace(char oldChar，char newChar)。

public String replace(CharSequence target，CharSequence replacement)------把原来的etarget子序列替换为replacement序列，返回新串。

public String replaceAll(String regex，String replacement)------用正则表达式实现对字符串的匹配。注意replaceAll第一个参数为正则表达式，鄙人曾经深受其害。

通过我自己的学习，我感觉其实最好的资料就是JDK的API，可以好好利用。

四:Java之字符串操作String、StringBuffer和StringBuilder,布布扣,bubuko.com

四:Java之字符串操作String、StringBuffer和StringBuilder

码农公寓

相关文章