5.1 "无继承"情况下的对象构造
考虑以下这个程序片段:
1 Point global;
2
3 Point foobar()
4 {
5 Point local;
6 Point *heap = new Point;
7 *heap = local;
8 // ... stuff ...
9 delete heap;
10 return local;
11 }
L1,L5,L6表现出三种不同的对象产生方式:global内存配置,local内存配置和heap内存配置.L7把一个 class object指定给还有一个,L10设定返回值,L9则明白地以 delete 运算符删除heap object.
一个object的生命是,该object的一个运行周期,local object的生命从L5的定义開始,到L10为止.global object的生命和整个程序的生命同样.heap
object的生命从它被 new 运算符配置出来開始,到它被 delete 运算符摧毁为止.
以下是Point的第一次声明,能够写成C程序.C++ Standard说这是一种所谓的Plain Of Data声明形式:
typedef struct {
float x, y, z;
} Point;
假设以C++来编译这段码,会发生什么事情?观念上,编译器会为Point声明一个trivial default constructor,一个trivial destructor,一个trivial copy constructor,以及一个trivial copy assignment operator.但实际上编译器会分析整个声明,并为它贴上Plain Of Data标签.
当编译器遇到这种定义:
1 Point global;
时,观念上Point的trivial constructor和destructor都会被产生并被调用,constructor在程序起始(startup)处被调用而destructor在程序的exit()处被调用(exit()由系统产生,放在main()结束之前).然而,其实那些trivial members要不是没被定义,就是没被调用,程序的行为一如它在C中的表现一样.
在C中,global被视为一个"暂时性的定义",由于它没有明白的初始化操作,一个"暂时性的定义"能够在程序中发生多次.那些实例会被链接器折叠起来,仅仅留下单独一个实体,被放在程序data segment中一个"特别保留给为初始化的global objects使用"的空间.
C++并不支持"暂时性的定义",这是由于 class 构造行为的隐含应用的缘故.global在C++中被视为全然定义.C++中全部全局对象都被当作"初始化过的数据"来对待.
foobar()函数中的L5,有一个Point object local,相同也是既没有被构造也没有被解构.Point object local假设没有先经过初始化,可能会成为潜在的程序bug——万一第一次使用它就须要其初始值的话(如L7).至于heap object在L6的初始化操作:
Point *heap = new Point;
会被转换为对 new 运算符(由library提供)的调用:
Point *heap = __new(sizeof(Point));
再一次强调,并没有default constructor施行于 new 运算符所传回的Point object上.L7对此object有一个赋值(赋值,assign)操作,假设local曾被适当地初始化过,一切就没有问题.
7 *heap = local;
其实这一行会产生编译器警告例如以下:
warning,line 7: local is used before being initialized.
观念上,这种指定操作会触发trivial copy assignment operator进行拷贝搬运操作.然而实际上此object是一个Plain Of Data,所以赋值操作(assignment)将仅仅是像C那样的纯粹位搬运操作,L9运行一个 delete 操作:
9 delete heap;
会被转换为对 delete 运算符(由libraray提供)的调用:
__delete(heap);
观念上,这种操作会触发Point的trivial destructor.但destructor要不是没有被产生就是没有被调用.最后,函数以传值(by value)的方式将local当作返回值传回,这在观念上会触发trivial copy constructor,只是实际上 extern 操作仅仅是一个简单的位拷贝操作,由于对象是一个Plain Of Data.
抽象数据类型 (Abstract Data Type)
下面是Point的第二次声明,在 public 接口下多了 private 数据,提供完整的封装性,但没有提供不论什么 virtual function:
class Point {
public:
Point(float x = 0.0, float y = 0.0 float z = 0.0)
: _x(x), _y(y), _z(z) {}
// no copy constructor, copy operator or destructor defined ...
private:
float _x, _y, _z;
};
这个经过封装的Point class,其大小并没有改变,还是三个连续的float,是的,不论 private,public 存取层,或是member function的声明,都不会占用额外的对象空间.
没有为Point定义一个copy constructor或copy operator,由于默认的位语意(default bitwise semantics,第二章51页)已经足够了.也不须要提供一个destructor,由于程序默认的内存管理方法也足够.
对于一个global实体:
Point global; // 实施Point::Point(0.0, 0.0, 0.0);
如今有了default constructor作用于其上,因为global被定义在全局范畴中,其初始化操作将延迟到程序激活(startup)时才開始(详见6.1节)
假设要对 class 中的全部成员都设定常量初值,那么给予一个 explicit initialization list会比較高效.甚至在local scope中也是如此.举个样例,考虑以下这个程序片段:
void mumble() {
Point local1 = {1.0, 1.0, 1.0};
Point local2;
// 相当于一个inline expansion
// explicit initialization 会略微快一些
local2._x = 1.0;
local2._y = 1.0;
local2._z = 1.0;
}
local1的初始化操作会比local2的高效,由于当函数的activation recored被放进程序堆栈时,上述initialization list中的常量就能够被放进local1内存中.
explicit initialization list带来三项缺点:
1.仅仅有当 class members都是 public 时,此方法才奏效.
2.仅仅能指定常量,由于它们在编译时期就能够被评估求值.
3.因为编译器并没有自己主动施行,所以初始化行为的失败可能会比較高一些.
explicit initialization list所带来的效率长处可以补偿其软件project上的缺点吗?
一般而言,答案是no.然而在某些特殊情况下又不一样.比如,也许以手工打造了一些巨大的数据结构如调色盘,或者正要把一堆常量数据倾倒给程序,那么explicit initialization list的效率会比 inline constructor好的多,特别是对全局对象而言.
在编译器层面,会有一个优化机制用来识别 inline constructor,后者简单地提供一个member-by-member的常量指定操作,然后编译器会抽取那些值,而且对待它们就好像是 explicit initialization list所供应的一样,而不会把constructor扩展成一系列的assignment指令.
于是,local Point object的定义:
{
Point local;
}
如今被附加上default Point constructor的 inline expansion:
{
// inline expansion of default constructor
Point local;
local._x = 0.0;local._y = 0.0;local._z = 0.0;
}
L6配置出一个heap Point object:
6 Point *heap = new Point;
如今则被附加一个"对default Point constructor的有条件调用操作":
Point *heap = __new(sizeof(Point));
if (heap != 0)
heap->Point::Point();
然后才又被编译器进行 inline expansion操作,至于把heap指针指向local object:
7 *heap = local;
则保持这简单的位拷贝操作,以传值方式传回local object,情况也是一样:
10 return local;
L9删除heap所指的对象:
9 delete heap;
该操作并不会导致destructor被调用,由于并没有明白地提供一个destructor函数实体.
观念上,Point class 有一个相关的default copy constructor,copy operator和destructor,然而它们都是无关紧要的,并且编译器实际上根本没有产生它们.
为继承做准备
第三个Point声明,将为"继承性质"以及某些操作的动态决议(dynamic resolution)做准备,当限制对z成员进行存取操作:
class Point {
public:
Point(float x = 0.0, float y = 0.0) : _x(x), _y(y) {}
// no destructor, copy constructor, or copy operator defined ...
virtual float z();
protected:
float _x, _y;
};
再一次强调,并未定义一个copy constructor,copy operator,destructor.全部的members都以数值来存取,因此在程序层面的默认语意的下,行为良好.
virtual functions的导入促使每个Point object拥有一个 virtual table Pointer.这个指针提供 virtual 接口的弹性,代价是:每个object须要一个额外的一个word空间.有什么重大影响吗?视应用情况而定!必须视它对多态设计所带来的实际效益的比例而定.
除了每个 class object多负担一个vptr之外,virtual function的引入也引发编译器对Point class 产生膨胀作用:
定义的constructor被附加了一些码,以便将vptr初始化.这些码必须被附加在不论什么base class constructor的调用之后,但必须在不论什么由使用者(程序猿)供应的代码之前.比如,以下就是可能的附加结果:
Point *Point::Point(Point *this, float x, float y) : _x(x), _y(y) {
// 设定object的virtual table pointer(vptr)
this->__vptr_point = __vtbl__point;
// 扩展member initialization list
this->_x = x;
this->_y = y;
// 传回this对象
return this;
}
合成一个copy constructor和一个copy assignment operator,并且其操作不再是trivial(但implicit destructor仍然是trivial).假设一个Point object被初始化或以一个derived class object赋值,那么以位为基础(bitwise)操作可能给vptr带来非法设定.
// copy constructor的内部合成
inline Point* Point::Point(Point *this, const Point &rhs) {
// 设定object的virtual table pointer(vptr)
this->__vptr_Point = __vtbl__Point;
// 将rhs坐标中的连续位复制到this对象,或是经由member assignment提供一个member ...
return this;
}
编译器在优化状态可能会把object的连续内容复制到还有一个object上,而不会实现一个精确地"以成员为基础"的赋值操作.C++ Standard要求编译器尽量延迟nontrivial memebrs的实际合成操作,直到真正遇到其使用场合为止.
1 Point global;
2
3 Point foobar()
4 {
5 Point local;
6 Point *heap = new Point;
7 *heap = local;
8 // ... stuff ...
9 delete heap;
10 return local;
11 }
L1的global初始化操作,L6的heap初始化操作以及L9的heap删除操作,都还是和稍早的Point版本号同样,然而L7的memberwise赋值操作:
*heap = local;
非常可能触发copy assignment operator的合成,以及其调用操作的一个 inline expansion(内部扩展);以 this 代替heap而以rhs代替local.
最戏剧性的冲击发生在以传值方式传回local的那一行(L10).因为copy constructor的出现,foobar()非常可能被转化为以下这样(详见2.3节):
// C++伪代码:foobar()的转化,用以支持copy constructor
Point foobar(Point &__result) {
Point local;
local.Point::Point(0.0, 0.0);
// heap的部分与前面同样...
// copy constructor的应用
__result.Point::Point(local);
// local对象的destructor将在这里运行调用Point定义的destructor:local.Point::~Point();
return;
}
假设支持named return value(NRV)优化,这个函数会进一步被转化为:
// C++伪代码:foobar()的转化
// 以支持named return value(NRV)优化
Point foobar(Point &__result) {
__result.Point::Point(0.0, 0.0);
// heap的部分与前面同样...
return;
}
</pre><pre name="code" class="cpp">T operator+(const T &, const T &) {
T result;
// ...真正的工作在此
return result;
}
那么提供一个copy constructor就比較合理--甚至即使default memberwise语意已经足够.它的出现会触发NRV优化.然而,就像前一个样例中所展现的那样,NRV优化后将不再须要调用copy constructor,由于运算结果已经被直接置于"将被传回的object"体内了.