关于 String,StringBuilder,StringBuffer 的讨论,已有很多文章;在这里,做一些自己的整理。
- String
String 是final类型,不可继承的类;内部存储是字符数组(char[]),也是final ,不可更改;
/** 源码中 String 类的声明 */
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
我们知道 final 修饰变量,只能被赋值一次,赋值成功后,不可再重新赋值。这意味怎么什么呢?先看一下下面的例子:
public static void main(String[] args) {
String a = "sdfsdklfjdskl1245";
String b = "1234567489123";
String c = a + b;
System.out.println(c);
}
这里声明三个字符常量,在初始化时,a 和 b 是字符数组常量,而 c 则是两个常量字符的连接;下面是反编译后的信息:
根据描述信息,c 变量是两个字符串连接的副本。(小弟知识范围有限,若上述代码解读有误,还请指正,不胜感激)
如果字符串直接拼接,又是怎样呢?
public static void main(String[] args) {
String a = "this is a" + " simple " + "test";
System.out.println(a);
}
看看编译后的代码解析:
可以看到编译过程做了优化,这里只产生了一个变量。
所以 String 字符串的拼接,关键在于字符串连接底层实现方式;字符串的实现是不可变字符数组,那拼接又是对字符数组怎样的操作呢?是数组拷贝?还是其他方式,有待考究... ...
String 字符串拼接效率低体现在什么地方呢?请看下面例子:
@Test
public void testString1() {
String a = "123456";
for (int i=0; i<10; i++) {
a += "dfdsfdsfds";
}
System.out.println(a);
}
上面代码中,我们初始化了常量 a,并且在循环里面做了多次字符串的拼接,最终 a 的指针地址指向了字符串拼接后的结果。
总结一下:
1、字符拼接过程产生了一定的字符数组;且是不可修改的。
2、每次改变字符串的值,就要重新生成一个String对象,然后将指针指向新的对象。
3、多余的对象一定程度上增加了GC的工作量。
综上,String 字符串拼接存在一定的性能消耗,但还不足以说性能低效;有比较才有优劣,再看看 StringBuilder 和 StringBuffer 内部又是做的呢?
- StringBuilder
StringBuilder 内部存储是字符数组,是可修改的;看一下父类:
abstract class AbstractStringBuilder implements Appendable, CharSequence {
/**
* The value is used for character storage.
*/
char[] value; /**
* The count is the number of characters used.
*/
int count;
添加字符串的方法是append,看看具体实现:
public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}
private void ensureCapacityInternal(int minimumCapacity) {
// overflow-conscious code
if (minimumCapacity - value.length > 0) {
value = Arrays.copyOf(value,
newCapacity(minimumCapacity));
}
}
public static char[] copyOf(char[] original, int newLength) {
char[] copy = new char[newLength];
System.arraycopy(original, 0, copy, 0,
Math.min(original.length, newLength));
return copy;
}
这里对字符数组做了拷贝,底层的数组拷贝实现方法:
public static native void arraycopy(Object src, int srcPos,
Object dest, int destPos,
int length);
可以看到,底层调用 System.arraycopy 方法,而 arraycopy 方法是调用底层 C 语言实现的。
通过上面的源码,得出一些结论:
1、StringBuilder 在字符串拼接过程中,是对字符数组的修改;
2、append 方法对数组做了动态扩容;
3、最终实现是通过 System.arraycopy 调用 C 语言的方法;
与 String 相比,由于 StringBuilder 是对数组的修改、动态扩容,减少了中间对象的生成,在一定程度上性能较优。
- StringBuffer
StringBuffer 与 StringBuilder 都继承了 AbstractStringBuilder;
public final class StringBuffer
extends AbstractStringBuilder
implements java.io.Serializable, CharSequence
{ /**
* A cache of the last value returned by toString. Cleared
* whenever the StringBuffer is modified.
*/
private transient char[] toStringCache;
@Override
public synchronized StringBuffer append(String str) {
toStringCache = null;
super.append(str);
return this;
}
不同的是 StringBuffer 添加了同步锁,是线程安全的;
小结:
在字符串拼接上,不考虑线程安全的情况下 StringBuilder 优于 StringBuffer,StringBuffer 优于 String;StringBuffer 是线程安全的。