原文链接:http://www.spongeliu.com/260.html
对于结构体和空类大小是1这个问题,首先这是一个C++问题,在C语言下空结构体大小为0(当然这是编译器相关的)。这里的空类和空结构体是指类或结构体中没有任何成员。
在C++下,空类和空结构体的大小是1(编译器相关),这是为什么呢?为什么不是0?
这是因为,C++标准中规定,“no object shall have the same address in memory as any other variable” ,就是任何不同的对象不能拥有相同的内存地址。 如果空类大小为0,若我们声明一个这个类的对象数组,那么数组中的每个对象都拥有了相同的地址,这显然是违背标准的。
但是,也许你还有一个疑问,为什么C++标准中会有这么无聊的规定呢?
当然,这样规定显然是有原因的。我们假设C++中有一个类型T,我们声明一个类型T的数组,然后再声明一个T类型的指针指向数组中间某个元素,则我们将指针减去1,应该得到数组的另一个索引。如下代码:
T array[5]; int diff = &array[3] - &array[2]; // diff = 1
上面的代码是一种指针运算,将两个指针相减,编译器作出如下面式子所示的动作:
diff = ((char *)&array[3] - (char *)&array[2]) / sizeof T;
式子应该不难懂把,很明显的一点就是这个式子的计算依赖于sizeof T。虽然上面只是一个例子,但是基本上所有的指针运算都依赖于sizeof T。
好,下面我们来看,如果允许不同的对象有相同的地址将会引发什么样的问题,看下面的例子:
&array[3] - &array[2] = &array[3] - &array[1]
= &array[3] - &array[1]
= &array[3] - &array[0]
= 0
我们可以看到,在这个例子中,如果每个对象都拥有相同地址,我们将没有办法通过指针运算来区分不同的对象。还有一个更严重的问题,就是如果 sizeof T是0,就会导致编译器产生一个除0的操作,引发不可控的错误。
基于这个原因,如果允许结构体或者类的大小为0,编译器就需要实现一些复杂的代码来处理这些异常的指针运算。
所以,C++标准规定不同的对象不能拥有相同的地址。那么怎样才能保证这个条件被满足呢?最简单的方法莫过于不允许任何类型的大小为0。所以编译器为每个空类或者空结构体都增加了一个虚设的字节(有的编译器可能加的更多),这样这些空类和空结构的大小就不会是0,就可以保证他们的对象拥有彼此独立的地址。