大型项目开发:谨慎使用智能指针

2022-01-19 08:18:45

智能指针使用上的问题

智能指针的使用太普遍了，它让程序员摆脱了内存管理的恶梦，但实际上智能指针本身也可能引入另一个恶梦。主要包括两个问题点:

性能问题。因为需要引入一些变量(bookkeeping)，甚至在多线程下的一些互斥操作，它所带来的性能开销往往比想像的要高。比如以智能指针作为函数参数以及返回值时。
对象释放的时机不明确。比如std::auto_ptr，总让人感觉不明不白。而有时一些循环引用，又会导致内存泄露。

所以即便有了智能指针，程序员还是要认真考虑使用它们的时机。

智能指针的本质是所有权管理

所有权(Ownership)是一个用来管理动态分配内存的记录(bookkeeping)技术。动态分配内存的所有者需要负责在所分配内存不再需要时释放它。共享所有权时，最后一个owner负责清理。即使不是共享，也可以在代码间传递Ownership。

运用智能指针的核心是保持所有权(Ownership)的明确、清晰。一般情况下是保证所有权的单一，无论是使用WeakPtr, Scoped Pointer都可以保持所有权的单一，这时所有权可以在不同的对象/代码段转移。另一种情况就是需要共享所有权，比较常用的引用指数智能指针，就是帮助完成共享所有权的。

概括起来三个要点：

1.局部化
推荐保持单一、固定的所有权。当所有权需要在不同代码段间传递时，就要使用智能指针。
2.明确的清理时机。
使用引用计数，和std::auto_ptr都会引发对释放时机的疑问。有可能引入一些隐晦的Bug。当需要共享所有权时，一定要先思考这个设计的必要性，以及内存释放的时机是否明确、清晰。
3.最好的方式不要使用指针。可以使用引用来代替指针。见后面WebKit的故事。

大型项目中的应用

Google Coding Style的约定

如果需要动态分配内存，尽量由分配的代码来持有所有权。
如果另一段代码需要访问对象，先考虑传递对象拷贝，指针或者引用，而不是传递所有权。如果确有需要时，建议使用std::unique_ptr来显示的传递所有权（使用std::move()）。
除非有好的理由，否则不要共享所有权。比如为了避免复制。这时需要确定有明显的性能收益，而且所持有的对象最好是只读的, 同时建议使用std::shared_ptr:

std::shared_ptr<const Foo>;

新代码里不要再使用scoped_ptr，更不要使用std::auto_ptr, 而是使用std::unique_ptr来代替。

WebKit的故事

WebKit文档记录了他们使用引用计数指针的故事，详情见:RefPtr Basics。大意为:
早在2005年时为了解决内存泄露问题，开始使用基于引用计数的智能指针，但是它有性能问题，特别是当作函数参数和返回值传递时。后来使用C++11提供move语义（即转移所有权的方式）来解决了这个问题。(另外shared_ptr const & 的形式也可以避免不必要的引用计数操作。)

而到了2013年，WebKit的开发者发现泛滥的判空和有效性检查，于是开始倾向于尽可能地使用引用（注意：不是引用计数指针）, 而不是指针。

小结

解决内存问题的最佳的途径仍然是由程序员管理好对象的生命周期。使用智能指针也是有成本的，同时也会引入一些新问题，所以需要遵循一些约定来使用。Google Chromium/Webkit都有相应用的定义:

另外明确约定一个函数是否会返回空指针,特别是对于API来说，也会帮助使用者避免一些不必要的判空处理和一些隐晦的Bug。

进一步学习:

码农公寓

智能指针使用上的问题

智能指针的本质是所有权管理

大型项目中的应用

Google Coding Style的约定

WebKit的故事

小结

相关文章