Vector扩容倍数后的数学推导

结论1 (1-2)之间的数

首先,vector最关键在于查询,使用移位运算(2的幂)直接得到哈希链以及节点长度,然后相减直接得到键值,复杂度为O(2)
这样的话,其性能近似于数组,插入删除可动态,达到了基本目的
显然,增长的倍数不可能很大,也不会比 1 小,那么,它的最佳上限是多少呢?如果以 大于2 倍的方式扩容,下一次申请的内存会大于之前分配内存的总和,导致之前分配的内存不能再被使用。所以,最好的增长因子在 (1,2)之间为宜。

k*(2 + 2 ^ 2 + 2 ^ 3 .....+ 2 ^ n )  
= k * (  (2 ^ n+1 ) - 1) 
<=  k*(2^n+1)

为什么不是大于两倍

如果以大于2倍的方式来进行扩容,下一次申请空间会大于之前申请所有空间的总和,这样会导致之前的空间不能再被重复利用,这样是很浪费空间的操作。所以,如果扩容一般基于(1, 2] 之间进行扩容

两倍的扩容有利于时间复杂度的降低

如果已成倍方式增长。假定有 n 个元素,倍增因子为 m; 完成这 n 个元素往一个 vector 中的 push_back​操作,需要重新分配内存的次数大约为 logm(n); 第 i 次重新分配将会导致复制 m^(i) (也就是当前的vector.size() 大小)个旧空间中元素; n 次 push_back 操作所花费的时间复制度为O(n)
Vector扩容倍数后的数学推导

m / (m - 1),这是一个常量,均摊分析的方法可知,vector 中 push_back 操作的时间复杂度为常量时间.​
如果一次增加固定值大小 。假定有 n 个元素,每次增加k个;第i次增加复制的数量为为:100i ;n 次 push_back 操作所花费的时间复杂度为O(n^2):
Vector扩容倍数后的数学推导
均摊下来每次push_back 操作的时间复杂度为O(n);
总结:对比可以发现采用采用成倍方式扩容,可以保证常数的时间复杂度,而增加指定大小的容量只能达到O(n)的时间复杂度,因此,使用成倍的方式扩容为宜.

对于空间的使用

1.5倍可以重复使用之前的空间,在C++标准中,并未规定是用多少倍,是由使用者根据自己的使用情况来判断的

上一篇:试除法求约数


下一篇:在Web微信应用中使用博客园RSS以及Quartz.NET实现博客文章内容的定期推送功能