大型项目开发:谨慎使用智能指针

智能指针使用上的问题

智能指针的使用太普遍了,它让程序员摆脱了内存管理的恶梦,但实际上智能指针本身也可能引入另一个恶梦。主要包括两个问题点:

  1. 性能问题。因为需要引入一些变量(bookkeeping),甚至在多线程下的一些互斥操作,它所带来的性能开销往往比想像的要高。比如以智能指针作为函数参数以及返回值时。
  2. 对象释放的时机不明确。比如std::auto_ptr,总让人感觉不明不白。而有时一些循环引用,又会导致内存泄露。

所以即便有了智能指针,程序员还是要认真考虑使用它们的时机。

智能指针的本质是所有权管理

所有权(Ownership)是一个用来管理动态分配内存的记录(bookkeeping)技术。动态分配内存的所有者需要负责在所分配内存不再需要时释放它。共享所有权时,最后一个owner负责清理。即使不是共享,也可以在代码间传递Ownership。

运用智能指针的核心是保持所有权(Ownership)的明确、清晰。一般情况下是保证所有权的单一,无论是使用WeakPtr, Scoped Pointer都可以保持所有权的单一,这时所有权可以在不同的对象/代码段转移。另一种情况就是需要共享所有权,比较常用的引用指数智能指针,就是帮助完成共享所有权的。

概括起来三个要点:

1.局部化
推荐保持单一、固定的所有权。当所有权需要在不同代码段间传递时,就要使用智能指针。
2.明确的清理时机
使用引用计数,和std::auto_ptr都会引发对释放时机的疑问。有可能引入一些隐晦的Bug。当需要共享所有权时,一定要先思考这个设计的必要性,以及内存释放的时机是否明确、清晰。
3.最好的方式不要使用指针。可以使用引用来代替指针。见后面WebKit的故事。

大型项目中的应用

Google Coding Style的约定

如果需要动态分配内存,尽量由分配的代码来持有所有权。
如果另一段代码需要访问对象,先考虑传递对象拷贝,指针或者引用,而不是传递所有权。如果确有需要时,建议使用std::unique_ptr来显示的传递所有权(使用std::move())。
除非有好的理由,否则不要共享所有权。比如为了避免复制。这时需要确定有明显的性能收益,而且所持有的对象最好是只读的, 同时建议使用std::shared_ptr:

std::shared_ptr<const Foo>;

新代码里不要再使用scoped_ptr,更不要使用std::auto_ptr, 而是使用std::unique_ptr来代替。

WebKit的故事

WebKit文档记录了他们使用引用计数指针的故事,详情见:RefPtr Basics。大意为:
早在2005年时为了解决内存泄露问题,开始使用基于引用计数的智能指针,但是它有性能问题,特别是当作函数参数和返回值传递时。后来使用C++11提供move语义(即转移所有权的方式)来解决了这个问题。(另外shared_ptr const & 的形式也可以避免不必要的引用计数操作。)

而到了2013年,WebKit的开发者发现泛滥的判空和有效性检查,于是开始倾向于尽可能地使用引用(注意:不是引用计数指针), 而不是指针。

小结

解决内存问题的最佳的途径仍然是由程序员管理好对象的生命周期。使用智能指针也是有成本的,同时也会引入一些新问题,所以需要遵循一些约定来使用。Google Chromium/Webkit都有相应用的定义:

另外明确约定一个函数是否会返回空指针,特别是对于API来说,也会帮助使用者避免一些不必要的判空处理和一些隐晦的Bug。

进一步学习:

  1. unique_ptr使用简介
  2. Reference counting smart pointers are for retards.
上一篇:Spark Core Runtime分析: DAGScheduler, TaskScheduler, SchedulerBackend


下一篇:Tensorflow入门1-CNN网络及MNIST例子讲解