《深度探索c++对象模型》chapter3 Data语意学

2023-12-05 12:28:28

一个空的class：如

class X{} ;

sizeof(X)==1;

sizeof为什么为1，他有一个隐晦的1 byte，那是被编译器安插进去的一个char，这使得class2的两个objects得以在内存中配置独一无二的地址：

X a,b;

if(&a==&b) cerr<<"yipes!"<<endl;

class X{};
class Y:public virtual X{};
class Z:public virtual X{};
class A:public Y,public Z{};

    cout<<"sizeof(X):"<<sizeof(X)<<endl;
    cout<<"sizeof(Y):"<<sizeof(Y)<<endl;
    cout<<"sizeof(Z):"<<sizeof(Z)<<endl;
    cout<<"sizeof(A):"<<sizeof(A)<<endl;

我的vs结果是1 ，4,4,8.

但是让人搞不懂的是Y、Z的大小。主要大小受三个因素的影响：

语言本身所造成的额外负担，当语言支持虚基类virtual base class的时候，就导致一个额外的负担，这个一般反映在某种形式的指针身上，它或者指向virtual base class subobject，或者指向一个相关表格。
编译器对于特殊情况所提供的优化处理，因为class X有1 byte的大小，这样就出现在了class Y和class Z身上。这个主要视编译器而定，比如某些存在这个1byte但是有些编译器就将他忽略了（因为已经用虚指针了所以这个1byte就可以不用作为内存中的一个定位）。这种情况是对empty virtual base的特殊处理，如VS。
Alignment的限制，就是所谓的对齐操作，比如你现在占用5bytes编译器为了更有效率地在内存中存取就将其对齐为8byte。
下面说明在vs2010中的模型，因为有了虚指针后所以1byte就不用了，所以class Y和class Z的大小就是4bytes，如下图：

《深度探索c++对象模型》chapter3 Data语意学

现在你觉得class A的大小应该是多少呢？一个虚基类子对象只会在派生类中存在一份实体，不管他在继承体系中出现多少次，所以公用一个1byte的classX实体，再加上class Y和class Z这样就有9bytes，如果有对齐的话就是12bytes但是vs2010中省略了那1byte所以就不存在对齐就直接是8bytes。谜底终于揭开了！！！

Data Member的绑定：the binding of a data member

Data Member的布局

类的static data member会放在程序的数据段（data segment）。

c++ standard要求，在同一个access section中，member的排列只需符合”较晚出现的members在class object中有较高的地址“这一条件即可。也就是说，各个members并不一定得连续排列。什么东西可能会介于被声明的members之间呢？members的边界调整（alignment）可能就需要填补一些bytes。

不同的access section的数据们放置没有强制的前后关系。vptr的放置也没有强制规定。

Data Member的存取

1）对于static data member，

每次程序取用static member，就会被内部转换为对该唯一的extern实体的直接参考操作。存取static members并不需要通过class object。对于继承而来的static member其存取路径也是同样直接。（因为static members只存在唯一的一份实体）

(如何有2个classes，每一个都声明了一个static member freelist;那么都被放在程序的data segment时，就会导致冲突，编译器的解决办法是暗中对每一个static data member编码（name-mangling),以获得一个独一无二的程序识别代码。任何name-mangline都有2个要点：

1.一种算法，推导出独一无二的名称

2.独一无二的名称可以轻易被推导回原来的名称。

（2）对于nonstatic data member，

每一个nonstatic data member的偏移量offset，在编译时期即可获知。（派生自单一或多重继承串链也一样）。

而当虚继承时，虚继承将为“经由base class subobject 存取 class members”导入一层新的间接性。

（2）对于nonstatic data member，

每一个nonstatic data member的偏移量offset，在编译时期即可获知。（派生自单一或多重继承串链也一样）。

nonstatic data member直接存放在class object之中，除非经由明确explicti或暗喻的implicit的class object，没有办法直接存取他们。只要程序员在一个member function直接处理一个nonstatic data member，所谓的”implicit class object“就会发生。例如：

Point3D Point3D::translate(const Point3D &pt){

x+=pt.x;

y+=pt.y;

z+=pt.z;

}

表面上所看到的对于x,y,z的直接存取，事实上是经由一个”implicit class object“（有this指针表达）完成，事实上这个函数的参数是：

Point3D Point3D::translate(Point3d * const thisconst Point3D &pt){

this->x+=pt.x;

this-> y+=pt.y;

this->z+=pt.z;

}

欲对一个nonstatic data member进行存取操作，编译器需要把class object的起始地址加上data member的偏移量（offset）。

举个例子，如：

class Point3d{

public:

//..

private:

float x;

static List<Point#d*> *freeList;

float y;

static const int chunkSize=250;

float z;

}

Point3d orgin;

origin._y=0.0;

那么地址&origin._y将等于

&origin+(&Point3d::_y-1);

请注意-1操作，指向data member的指针，其offset值总是被加上1，这样可以是编译系统区分出”一个指向data member的指针，用以指出class的第一个member”和“一个指向data member的指针，没有指出任何member”两种情况。

每一个nonstatic data member的偏移量（offset）在编译时期即可货值，甚至一个member属于一个base class subobject（派生自单一或多重继承串链）也是一样，因此，存放一个nonstatic data member，其效率和存取一个c struct member或一个nondervied class的member是一样的。

必须通过对象才能访问nonstatic data member（要不然访问的是谁的data member呢）。方法为对象的地址加上data member的offset就是这个data member的地址。

但在有虚拟继承的情况下，由于“经由base class subject存取class member”导入一层新的间接性，访问的时候，会有不同。考虑如下代码：

Point3d origin, *pt;

origin.x = 0;

pt->x;

由于origin一定是Point3d类型，所以origin.x编译时即可确定其offset。

从origin和pt存取有何差异？

答：当Point3d是一个derived class，而在其继承结构中有一个virtual base class，并且被存取的member是一个从该virtual base class继承而来的member时，有差异。

从pt存取，这时我们不知道pt指向哪一种class type，即无法知道编译时期这个member真正的offset位置，这个存取操作必须延迟至执行期，经由一个额外的间接引导，才能够解决。存取速度比较慢一些。从origin存取，origin的类型是明确的，members的offset位置在编译时期就固定了

继承与Data Member

在c++继承模型中，一个dervied class object所表现的东西，是其自己的member是加上其base class member的总和。在大部分编译器中，base class member总是先出现，但属于virtual base class的除外（一般而言，任何规则一旦碰上virtual base class就没辙了，这里也不例外）。

《深度探索c++对象模型》chapter3 Data语意学,布布扣,bubuko.com

《深度探索c++对象模型》chapter3 Data语意学

码农公寓

相关文章