今天写程序,人为制造了一个由浅拷贝引起的bug,有必要归纳一下。先附上源代码:
class PerformanceTest(object):
def __init__(self):
.......
self.basic_path_list=[]
.......
#这就是一个生成基础路径名的函数,从26个字符中选择五个字符加上‘/‘构成基础路径
def _get_basic_path_list(self,path_num):
.......
self.basic_path_list.append(path)
.......
.......
#这是一个对用Elementtree实现的xml树进行测试的测试函数,首先需要的就是生成测试路径列表
#建立一颗结点数目为test_num,满child_num叉树
def add_performance_test(self,child_num,test_num):
.......
#mid_list=deepcopy(self.basic_path_list)
#path_list=deepcopy(self.basic_path_list)
mid_list=self.basic_path_list
path_list=self.basic_path_list
while len(path_list)<test_num:
child_list=[]
for mid_path in mid_list:
for spath in self.basic_path_list:
path=mid_path+spath
child_list.append(path)
if len(path_list)+len(child_list)>test_num:
path_list+=child_list[:test_num-len(path_list)]
break
else:
path_list+=child_list
mid_list=child_list
#接下来就是将path_list中所有元素添加到自己定义的xml树中,代码略
......
结果,我在执行add_performance_test(2,100)函数后发现,生成的xml文件中目录树居然有9层。
100=1+2+4+8+16+32+37,应该是7层,却生成了9层目录,bug在哪里?
经过一段时间的调试后,确信是self.basic_path_list值在执行过程中起了变化,这是绝对不应该的。后来回想起初学python时看到的关于浅拷贝和深拷贝的内容,恍然大悟。mid_list和path_list在赋值的时候均执行的是浅拷贝,path_list在循环中改变时,也改变了self.basic_path_list值。
找到了问题,在赋值时将浅拷贝替换为深拷贝,代码就正常运行了。
这个错误给我敲响了警钟,像这样的bug代码不会报错,但根本得不到需要的结果。我仔细检查了以前写的代码,还发现了几处类似的浅拷贝,尤其是运行那些代码可以得要预期结果,但为了保险起见,我还是将其均替换为深拷贝。
在最后摘录一部分python核心编程中对于浅拷贝和深拷贝的描述,望以后写程序时引以为戒。
序列类型的可以通过三种方式实现浅拷贝,浅拷贝也是默认的拷贝类型:(1)完全切片操作;(2)利用工厂函数,比如list()等;(3)使用copy模块中的copy()函数。然而对于非容器类型没有拷贝这这一说。
有几点关于拷贝操作的警告。第一,非容器类型(比如数字,字符串和其他"原子"类型的对象,像代码,类型和xrange对象等)没有深拷贝一说,浅拷贝是用完全切片操作来完成的.第二,如果元组变量只包含原子类型对象,对它的深拷贝将不会进行.