StringBuilder的实现

先看看MS给出的官方解释吧

http://msdn.microsoft.com/zh-cn/library/system.text.stringbuilder(VS.80).aspx

String 对象串联操作总是用现有字符串和新数据创建新的对象。StringBuilder 对象维护一个缓冲区,以便容纳新数据的串联。如果有足够的空间,新数据将被追加到缓冲区的末尾;否则,将分配一个新的、更大的缓冲区,原始缓冲区中的数据被复制到新的缓冲区,然后将新数据追加到新的缓冲区。

String 或 StringBuilder 对象的串联操作的性能取决于内存分配的发生频率。

给实现者的说明 此实现的默认容量是 16,默认的最大容量是 Int32.MaxValue。

我只截取了最核心的一段,从这段我们就基本可以明白,StringBuilder的(后面直接简称sb,无节操的兄弟们,不要乱想,我也尽量不引导你们)实现,不过不看看源码,只看文档还是比较但蛋疼,理解不深。所以还是来看看其实现吧。

二话不说,先上一段定义,ok(只取了几个构造函数)

public sealed class StringBuilder : ISerializable
{
    // Methods
    public StringBuilder();
    public StringBuilder(int capacity);
    public StringBuilder(int capacity, int maxCapacity);
}
那我们最常用的两个,一个是无参构造,一个是整形构造,查看其源码其实都是调用了下面这个构造函数,给出其源码
public StringBuilder(int capacity, int maxCapacity)
{
    this.m_currentThread = Thread.InternalGetCurrentThread();
    if (capacity > maxCapacity)
    {
        throw new ArgumentOutOfRangeException("capacity", Environment.GetResourceString("ArgumentOutOfRange_Capacity"));
    }
    if (maxCapacity < 1)
    {
        throw new ArgumentOutOfRangeException("maxCapacity", Environment.GetResourceString("ArgumentOutOfRange_SmallMaxCapacity"));
    }
    if (capacity < 0)
    {
        throw new ArgumentOutOfRangeException("capacity", string.Format(CultureInfo.CurrentCulture, Environment.GetResourceString("ArgumentOutOfRange_MustBePositive"), new object[] { "capacity" }));
    }
    if (capacity == 0)
    {
        capacity = Math.Min(0x10, maxCapacity);
    }
    this.m_StringValue = string.GetStringForStringBuilder(string.Empty, capacity);
    this.m_MaxCapacity = maxCapacity;
}
两个参数一个是容量大小,另一个是最大容量。
这个构造做了些什么
1.  获取当前线程句柄
2.  做一些必要性的验证和判断
3.  调用了这个方法
string.GetStringForStringBuilder(string.Empty, capacity);
 
这个方法最终调用了这个方法
internal static unsafe string GetStringForStringBuilder(string value, int startIndex, int length, int capacity)
{
    string str = FastAllocateString(capacity);
    if (value.Length == 0)
    {
        str.SetLength(0);
        return str;
    }
    fixed (char* chRef = &str.m_firstChar)
    {
        fixed (char* chRef2 = &value.m_firstChar)
        {
            wstrcpy(chRef, chRef2 + startIndex, length);
        }
    }
    str.SetLength(length);
    return str;
}
其实就是分配了string控件,复制了一份,并返回了。

然后我们看下append方法,很多重载,其实都是调用了

public StringBuilder Append(string value)
{
    if (value != null)
    {
        string stringValue = this.m_StringValue;
        IntPtr currentThread = Thread.InternalGetCurrentThread();
        if (this.m_currentThread != currentThread)
        {
            stringValue = string.GetStringForStringBuilder(stringValue, stringValue.Capacity);
        }
        int length = stringValue.Length;
        int requiredLength = length + value.Length;
        if (this.NeedsAllocation(stringValue, requiredLength))
        {
            string newString = this.GetNewString(stringValue, requiredLength);
            newString.AppendInPlace(value, length);
            this.ReplaceString(currentThread, newString);
        }
        else
        {
            stringValue.AppendInPlace(value, length);
            this.ReplaceString(currentThread, stringValue);
        }
    }
    return this;
}

这里做了什么呢,

  1. 获取新字符串的长度,
  2. NeedsAllocation方法判断当前容量是否可以容纳新串,如果不能,重新生成新字符串

否则直接添加到旧的字符串中,实现方法如下

internal unsafe void AppendInPlace(string value, int currentLength)
{
    int length = value.Length;
    int index = currentLength + length;
    fixed (char* chRef = &this.m_firstChar)
    {
        fixed (char* chRef2 = &value.m_firstChar)
        {
            wstrcpy(chRef + currentLength, chRef2, length);
        }
        chRef[index] = '\0';
    }
    this.m_stringLength = index;

}

了解了上面的大概内容基本上也就知道了,sb的实现原理,正如msdn解释的一样。

那么知道了这些有个屁用呢,msdn中也解释了,性能取决于内存分配的发生频率,既然知道了性能问题,那么以后我们写的时候是不是需要估计下字符串的大小呢。比如我们经常在后台拼接html字符串,sb的初始默认大小是16,每次容量不够,大小翻倍重新分配,(

int capacity = currentString.Capacity * 2;创建新字符串的函数代码忘了贴,看了前面的实现基本就能猜到了,其中就这一句对我们比较有用

)相信我们随便拼一个长度就要远大于16吧,这就导致了大量的内存分配发生,降低了效率,(这里就可以猜测string的连接操作应该是每次都进行内存分配)所以,sb初始预估大小还是很有用的。

上一篇:linux系统日志使用


下一篇:SpringBoot+gradle项目构建war