https://cnodejs.org/topic/5189ff4f63e9f8a54207f60c
1、拼接字符串时,String比buffer要快,buffer需要toString()。当保存非utf-8字符串,2进制等等其他格式的时候,需要使用buffer。
var string3, buffer3; console.time(‘write 1024*1024*10 string‘); for(var j=0; j<1024*1024*10; j++){ var x = j+‘‘; string3 += x; } console.timeEnd(‘write 1024*1024*10 string‘); console.time(‘write 1024*1024*10 buffer‘); buffer3 = new Buffer(1024*1024*10); for(var j=0; j<1024*1024*10; j++){ var x = j+‘‘; buffer3.write(x, j); } console.timeEnd(‘write 1024*1024*10 buffer‘);
//注意console的写法;buffer的创建,拼接。
2、buffer 8KB 会导致内存泄露
当我们实例化一个新的Buffer类,会根据实例化时的大小去申请内存空间,如果需要的空间小于8KB,则会多一次判定,判定当前的8KB载体剩余容量是否够新的buffer实例,如果够用,则将新的buffer实例保存在当前的8KB载体中,并且更新剩余的空间。如果不够用,则新申请一个8KB,并作为当前载体。
3、buffer拼接方法性能比较
var buf = new Buffer(‘sasdasd‘); console.time(‘string += buf‘); var s = ‘‘; for(var j=0; j<100000; j++){ s += buf; } console.log(‘s.length:‘+s.length); console.timeEnd(‘string += buf‘); console.time(‘buf concat‘); var list = []; var len = 0; for(var j=0; j<100000; j++){ list.push(buf); len += buf.length; } var s2 = Buffer.concat(list, len).toString(); console.log(‘s2.length:‘+s2.length); console.timeEnd(‘buf concat‘);
//后者要快
到这一步,我脑子就抽风了,想比较一个1的第二种方法 和 3的第二种方法,哪种更快:
var buf = new Buffer(‘sasdasd‘); console.time(‘write 1024*1024*10 buffer‘); var buffer3 = new Buffer(700000); for(var j=0; j<100000; j++){ var x = ‘sasdasd‘; buffer3.write(x, j); } console.log(‘buffer3.length:‘+buffer3.length); console.timeEnd(‘write 1024*1024*10 buffer‘); console.time(‘buf concat‘); var list = []; var len = 0; for(var j=0; j<100000; j++){ list.push(buf); len += buf.length; } var s2 = Buffer.concat(list, len).toString(); console.log(‘s2.length:‘+s2.length); console.timeEnd(‘buf concat‘);
写法有些变化,不过还是后一种更快。
接下来说说+=更容易出现的错误:根据《深入浅出node.js》
1、data += chunk; 等价于 data.toString() = data.toString() + chunk.toString();
2、toString()默认utf-8编码,这种情况下中文占3个字节,中文是宽字节编码,chunk有可能截断中文字符串,导致有些字节显示为乱码。