C++内存中的封装、继承、多态（下）

2022-03-18 10:27:03

上篇讲述了内存中的封装模型，下篇我们讲述一下继承和多态。

二、继承与多态情况下的内存布局

由于继承下的内存布局以及构造过程很多书籍都讲得比较详细，所以这里不细讲。重点讲多态。

继承有以下这几种情况：

1.单一继承

2.多重继承

3.重复继承

4.虚拟继承

1.单一继承的场合

假设有以下继承关系，那么大致的内存布局如下

代码

class Parent

{

public:

    int p;

};

class Child:public Parent

{

public:

    int c;

};

class GrandChild:public Child

{

public:

    int gc;

};

对象布局：

成员变量的布局很好理解，那么在有虚函数的场合，虚函数表到底又是怎么样的呢？

为了解决这个问题我完善上面的代码。

class Parent

{

public:

    Parent():p(){}

    virtual void fun1(){ cout<<"Parent::fun1"<<endl; }

    virtual void fun2(){ cout<<"Parent::fun2"<<endl; }

    virtual void fun3(){ cout<<"Parent::fun3"<<endl; }

    int p;

};

class Child:public Parent

{

public:

    Child():c(){}

    virtual void fun1()  { cout<<"Child::fun1"<<endl; }

    virtual void c_fun2(){ cout<<"Child::c_fun2"<<endl; }

    virtual void c_fun3(){ cout<<"Child::c_fun3"<<endl; }

    int c;

};

class GrandChild:public Child

{

public:

    GrandChild():gc(){}

    virtual void fun1()  { cout<<"GrandChild::fun1"<<endl; }

    virtual void c_fun2(){ cout<<"GrandChild::c_fun2"<<endl; }

    virtual void gc_fun3(){ cout<<"GrandChild::gc_fun3"<<endl; }

    int gc;

};

int main()

{

    GrandChild grandc;

    Child       child;

    Parent     parent;

    return ;

}

我们先使用调试窗口查看一下虚函数表

可以看到三张表是不同的，可以看到fun1函数被改写了两次。

比较蛋疼的是grandc只能看到三个函数，君不见c_fun2和gc_fun3，还得自己动手来。

继上篇的内容，我们使用pf这个函数指针：

typedef void (*PF)();
PF pf = NULL;

在主函数里我们写下代码：

    int* vtab = (int*)*(int*)&grandc;

    for (; *vtab != NULL; vtab++)

    {

        pf = (PF)*vtab;

        pf();

    }

    int* member = (int*)&grandc;

    cout<<*++member<<endl;

    cout<<*++member<<endl;

    cout<<*++member<<endl;

成员变量输出结果与我们上篇的结论一致，咱们主要来看一下虚函数部分。

并且前三个函数同调试窗口的显示结果。

我们依据以上结果可以得到这么几个结论：

1.单一继承时，不同的类维护不同的虚函数表（only one），并且虚函数表初始情况是父类的样子。

2.当发生overwrite时，例如fun1和c_fun2都会冲刷掉父类的虚函数，代替之。

3.没有发生overwrite时，直接添加到虚函数表中。

图示：

截止到这里，结合上篇的内容，就能很容易理解为什么使用父类指针能产生多态的效果了。

2.多重继承的场合

假设有以下继承关系，那么大致的内存布局如下

由于是多继承，根据1的观点，单一继承时一个类维护一个虚函数表。多继承时怎么办呢？

那只能是继承几个类，就有几张虚函数表了。

实例代码如下：

class Base1

{

public:

    Base1():b1(){}

    virtual void fun1(){ cout<<"Base1::fun1"<<endl; }

    virtual void fun2(){ cout<<"Base1::fun2"<<endl; }

    virtual void fun3(){ cout<<"Base1::fun3"<<endl; }

    int b1;

};

class Base2

{

public:

    Base2():b2(){}

    virtual void fun1(){ cout<<"Base2::fun1"<<endl; }

    virtual void fun2(){ cout<<"Base2::fun2"<<endl; }

    virtual void fun3(){ cout<<"Base2::fun3"<<endl; }    

    int b2;

};

class Base3

{

public:

    Base3():b3(){}

    virtual void fun1(){ cout<<"Base3::fun1"<<endl; }

    virtual void fun2(){ cout<<"Base3::fun2"<<endl; }

    virtual void fun3(){ cout<<"Base3::fun3"<<endl; }

    int b3;

};

class Derived:public Base1, public Base2, public Base3

{

public:

    Derived():d(){}

    virtual void fun1(){ cout<<"Derived::fun1"<<endl; }

    virtual void d_fun(){ cout<<"Derived::d_fun"<<endl; }

    int d;

};

通过调试窗口查看一下虚函数表：

可以明确的看到标注了for base，源自哪个基类的虚函数表。

并且可以看到fun1在三个表中全部被重写了，那么我们关心的d_fun到底会放在哪个表呢？

我们使用相同的办法：

typedef void (*PF)();
PF pf = NULL;

    Derived dd;

/////////////Base1///////////

    int* vtab1 = (int*)*(int*)&dd;

    for (; *vtab1 != NULL; vtab1++)

    {

        pf = (PF)*vtab1;

        pf();

    }

    int* member1 = (int*)&dd;

    cout<<*++member1<<endl;

/////////////Base2///////////

    int* vtab2 = (int*)*((int*)&dd + sizeof(Base1)/);

    for (; *vtab2 != NULL; vtab2++)

    {

        pf = (PF)*vtab2;

        pf();

    }

    int* member2 = (int*)((int*)&dd + sizeof(Base1)/);

    cout<<*++member2<<endl;

/////////////Base3//////////////

    int* vtab3 = (int*)*((int*)&dd + (sizeof(Base1)+sizeof(Base2))/);

    for (; *vtab3 != NULL; vtab3++)

    {

        pf = (PF)*vtab3;

        pf();

    }

    int* member3 = (int*)((int*)&dd + (sizeof(Base1)+sizeof(Base2))/);

    cout<<*++member3<<endl;

偷了点懒，因为使用的是int型，所以没有存在字节对齐的情况，直接使用的sizeof/4,使用这种偏移量来访问不同的base区域。

以下是输出结果：

我们可以看到d_fun被放到了第一个函数表中去了（声明的次序的第一个，实例代码是base1的部分）。

结论：

1.多重继承的场合，overwirte时，父类的函数在三个表中会全部被重写。

2.子类新添加的虚函数被放到第一个虚函数表中。

图示：

3.重复继承的场合

其实重复继承只是多重继承的特例，一切的规则依然按照多重继承的规则实行。只是特殊在祖父类生成了两个拷贝镜像，形成数据重复，并且造成二义性。

无论从设计的的角度还是维护的角度，这都是一个失败的选择。

所以我们不重点讨论，直接跳到虚拟继承。

4.虚拟继承的场合

关于虚拟继承的对象模型，其实有多种方法，本文使用的的环境是vs2008，属于微软想的招儿。《深入C++对象模型》一书中明确指出了

虚拟继承的场合，对象模型的构建方式没有固定的标准，主要的思路是拆分成不变局部和共享局部。当然只有更好的方法，也都是为了达到更高的存取效率。

所以本文描述的内存布局或许只在微软编译器的场合成立，正因为如此，我们把重点放在虚拟继承的要达到的效果上。

假设有以下继承关系：

实例代码：

class Base

{

public:

    Base():b(){}

    virtual void fun(){   cout<<"Base::fun"<<endl; }

    virtual void B_fun(){ cout<<"Base::B_fun"<<endl; }

    int b;

};

class Base1:virtual public Base

{

public:

    Base1():b1(){}

    virtual void fun(){    cout<<"Base1::fun"<<endl; }

    virtual void fun1(){   cout<<"Base1::fun1"<<endl; }

    virtual void B_fun1(){ cout<<"Base1::B_fun1"<<endl; }

    int b1;

};

class Base2:virtual public Base

{

public:

    Base2():b2(1){}

    virtual void fun(){    cout<<"Base2::fun"<<endl; }

    virtual void fun2(){   cout<<"Base2::fun2"<<endl; }

    virtual void B_fun2(){ cout<<"Base2::B_fun2"<<endl; }    

    int b2;

};

class Derived:public Base1, public Base2

{

public:

    Derived():d(){}

    virtual void fun(){   cout<<"Derived::fun"<<endl; }

    virtual void fun1(){  cout<<"Derived::fun1"<<endl; }

    virtual void fun2(){  cout<<"Derived::fun2"<<endl; }

    virtual void D_fun(){ cout<<"Derived::D_fun"<<endl; }    

    int d;

};

先来讨论单一虚拟继承的情况，看一下Base1的布局：

bb是Base的对象，bb1是Base1的对象。

明显可以看到与普通单一继承不同，使用了两个虚函数指针，一个指向了虚基类Base的表，以及自己再生成一个表。

而指向虚基类Base的表的虚函数fun明显被重写了。

使用代码读取：

int* vtab = (int*)*(int*)&bb1;

    for (; *vtab != NULL; vtab++)

    {

        pf = (PF)*vtab;

        pf();

    }

这个循环运行会中断，原因是vtab访问了一个神奇的数字-4，这个是用来隔开的，不小心访问了。（陈皓老师的一篇博文《C++对象的内存布局》也遇到了相同的问题，而GCC却没有）

足以证明，这里的不变局部是Derived自己后来添加的函数。而共享局部fun跑到虚基类包含的虚函数表上去了。

我们使用二级指针来解决中断的问题。

Base1 bb1;

    int** pVtab = (int**)&bb1;

    //////Base1//////////

    pf = (PF)pVtab[][];

    pf(); //Base1::fun1

    pf = (PF)pVtab[][];

    pf(); //Base1::B_fun1

    //cout << pVtab[0][2] << endl;//访问是一个随机值，证明越界了。

    cout << pVtab[][] << endl;//-4

    cout << (int)*((int*)(&bb1)+) <<endl; //b1

    cout <<"0x"<<(int*)*((int*)(&bb1)+) <<endl;//NULL 父类子类分隔处

    //////Base//////////

    pf = (PF)pVtab[][];

    pf();

    pf = (PF)pVtab[][];

    pf();

    cout << pVtab[][] << endl;//0x00

    cout << (int)*((int*)(&bb1)+) <<endl; //b

可以看出内存布局：

1.不变布局（子类）放在对象模型的前端，共享布局（虚基类）放在尾端。

2.其中子类部分，虚函数表使用了-4作为分隔结尾。接下来是子类成员变量值

3.虚基类属于共享局部，是一个正常的虚函数表布局，并且重写了fun函数。

图示：

这样是能够保证共享部分处于虚基类中（包括虚函数表），不变部分处于子类中。

接下来看完整的继承结构，解析Derived的布局。

使用代码：

Derived dd;

    int** pVtab = (int**)&dd;

    //////Base1//////////

    pf = (PF)pVtab[][];

    pf(); 

    pf = (PF)pVtab[][];

    pf();

    cout << pVtab[][] << endl;//-4

    cout << (int)*((int*)(&dd)+) <<endl; //b1

    //////Base2//////////

    pf = (PF)pVtab[][];

    pf();

    pf = (PF)pVtab[][];

    pf();

    cout << pVtab[][] << endl;//-4

    cout << (int)*((int*)(&dd)+) <<endl; //b2

    //////Derived 成员//////////

    cout << (int)*((int*)(&dd)+) <<endl; //d

    //////NULL虚基类分隔//////////

    cout << "0x"<<(int*)*((int*)(&dd)+) <<endl;

    pf = (PF)pVtab[][];

    pf();

    pf = (PF)pVtab[][];

    pf();

    cout << (int)*((int*)(&dd)+) <<endl; //b

运行结果：

与单一虚拟继承类似：

1.按照声明的次序，不变布局（父类）依次放在对象模型的前端，共享布局（虚基类）放在最尾端。

2.其中不变布局部分，虚函数表使用了-4作为分隔结尾。接下来是子类成员变量值

3.虚基类属于共享局部，是一个正常的虚函数表布局，并且重写了fun函数。

图就不画了，与单一虚拟继承的情况类似。

引用《深入C++对象模型》一书的描述：

要在编译器中支持虚拟继承，困难度颇高。

难度在于，要找到一个足够有效的办法，将Base1和Base2各自维护的Base部分，折叠成为一个由Derived单一维护的Base部分，并且还可以保持base class和Derived class的指针之间的多态操作。

这也整是虚拟继承要达到的效果。

至此，全篇差不多讲完了。

主要参考书籍《深入C++对象模型》以及上文提到的陈皓老师的博文，内容稍长，难免有纰漏，望大家指正。

码农公寓

相关文章