首先我们先看一下C程序的返回值处理情况,我们知道当C函数返回int等小型数据时直接将返回值放入eax寄存器。那当返回大的数据结构又是如何处理呢?看如下一段代码:
#include <stdio.h> typedef struct big_thing { char buf[128]; }big_thing; big_thing return_test() { big_thing b; b.buf[0]=0; retutn b; } int main(int argc, char *argv[]) { big_thing n=return_test(); return 0; }
根据这段代码的汇编代码可以知道这段代码是这样执行的:
1. 首先main函数在栈上开辟了一片空间,并将这块空间的一部分作为传递返回值的临时对象temp;
2. 将temp对象的返回地址作为隐含参数传递给return_test();
3. return_tes()函数将数据拷贝给temp对象(对应下图复制1),并将temp对象的地址用eax寄存器传出;
4. return_test()函数返回后,main函数将eax指向的temp对象拷贝给对象n(对应下图复制2)。
(上图为函数调用的栈情况,绿色部分代表main函数的活动记录,黄色部分为return_test的活动记录。)
看过C程序的返回值得处理过程,我们不妨先推测一下C++的返回值处理过程:总体与C的返回过程类似,只不过在上图复制1中并不是直接执行“位逐次拷贝”,而是调用拷贝构造函数(因为此时产生了新对象——temp),在复制2的时候需要调用赋值运算符(因为此时没有新的对象产生)。下面我们进行验证。
class X { public: X() {cout<<"X()"<<endl;}; X(const X& x) { cout<<"X(const X& x)"<<endl; } X& operator=(const X&) { cout<<"="<<endl; return *this; } ~X() {cout<<"destructor"<<endl;} }; X return_test() { X x; cout<<"before return"<<endl; return x; } int _tmain(int argc, _TCHAR* argv[]) { X xx; xx=return_test(); }
运行结果如下:
我们看到结果和我们预想的一样,在return前调用了拷贝构造函数(用来生成临时对象),函数返回后,函数内部的临时变量x先销毁,然后调用赋值运算符(对应图中复制2),将临时对象拷贝给xx;之后销毁临时对象temp,main退出时销毁xx。
2.1 RVO
那么如果我们将main中的两句简化为一句:
xx=return_test();
结果又如何呢?运行之后结果如下:
我们发现不再有赋值运算符被调用,也就是“复制2”不在发生,但是拷贝构造函数依然调用,说明“复制1”还是发生了。这是什么原因呢?
首先,我们必须清楚C++创建对象的方式,不要以为创建对象都要调用无参构造函数,当有“=”时是需要调用拷贝构造函数的(这句话也不准确,祥见系列三)。那么具体是如何发生的呢?这里我们介绍一下C++编译器采用的一个优化Return Value Optimization(RVO)。
RVO:
RVO其实就是编译器直接将返回对象通过拷贝构造函数构建在目的对象位置上,而不是临时对象(这种情况不再有临时对象);
具体到编译器是这样执行的:
1. 首先为return_test加上一个额外参数(隐含参数);类型是Class Object的一个引用(同C程序中的临时变量的目的地址,不过此处不再是临时变量,而是目的对象的地址)。这个参数用来放置被“拷贝构建”而返回的值。
2. return前安插了一个拷贝构造函数的调用操作,一边将返回的对象的内容(return_test中的局部变量x)当做上述新增参数的初值。
也就是说return_test将会被改变为:
void return_test(X& result)
{
X x;
result.X::X(x); //编译器产生的操作
return;
}
而对 xx=return_test();的调用也会被修改为
X xx;//(注:这里不再调用构造函数,只分配空间)
return_test(xx);
2.2 扩展
如果return_test().memfun()又该怎么被修改调用呢(其中memfun是X的成员函数)?
答案是:X temp;(注:此处仍不会调用构造函数,只是开辟空间,内容由随后的拷贝构造函数构造)
(return_test(temp),temp).memfun();(注意逗号表达式)
总结:无论采用什么方式,C++返回对象时总是伴随至少一次复制,所以应尽量避免返回对象。