导读
sizeof是C/C++一个难点,当在自定义类上应用sizeof操作符时,总会出现意想不到的结果,下面,我们就来探讨一下sizeof这个操作符!
目录
1. sizeof与strlen的区别
2. sizeof作用于结构体
3. 字节对齐问题
4. sizeof作用于类
正文
1. sizeof与strlen的区别
这是老生常谈的问题了,下面举一个例子大家就明白了。
char buf[] = "hello world!";
cout<<sizeof(buf)<<endl;
cout<<strlen(buf)<<endl;
output: 13 12
结论:sizeof只计算字符串真正的长度,不带字符串结束标记('\0');而strlen则计算‘\0’
还有一点需要注意的是,sizeof是操作符,strlen是函数,两者之间存在着根本的区别。
2. sizeof作用于结构体/类
先看下面程序输出的结果:
#include<iostream>
#include <string.h> using namespace std; typedef struct
{
int a;
}A_t; typedef struct
{
char a;
}B_t; typedef struct
{
int a;
char b;
}C_t; typedef struct
{
int a;
char b;
char c;
}D_t; typedef struct
{
char a;
int b;
char c;
}E_t; int main()
{
cout<<"sizeof(A_t):"<<sizeof(A_t)<<endl;
cout<<"sizeof(B_t):"<<sizeof(B_t)<<endl;
cout<<"sizeof(C_t):"<<sizeof(C_t)<<endl;
cout<<"sizeof(D_t):"<<sizeof(D_t)<<endl;
cout<<"sizeof(E_t):"<<sizeof(E_t)<<endl;
return ;
}
output:
$./sizeof
sizeof(A_t):
sizeof(B_t):
sizeof(C_t):
sizeof(D_t):
sizeof(E_t):
为什么输出的结果和我们的猜想是不符合的呢?到底是什么在影响结构体的大小?这就是下面我们要来分析的。
这一切的原因可以归结为字节对齐问题!
3. 字节对齐问题
3. 1 对齐跟数据在内存中的位置有关。
如果一个变量的内存地址正好位于它长度的整数倍,他就被称做自然对齐。
比如在32位cpu下,假设一个整型变量的地址为0x00000004,那它就是自然对齐的。
3.2 为什么需要字节对齐
需要字节对齐的根本原因在于CPU访问数据的效率问题。
struct A
{
char a1;
char a2;
int b;
char c;
};
假设上面整型变量的地址不是自然对齐,比如为0x00000002,则CPU如果取它的值的话需要访问两次内存,第一次取从0x00000002-0x00000003的一个short,
第二次取从0x00000004-0x00000005的一个 short然后组合得到所要的数据,如果变量在0x00000003地址上的话则要访问三次内存,第一次为char,第二次为short,第三次为 char,
然后组合得到整型数据。而如果变量在自然对齐位置上,则只要一次就可以取出数据。一些系统对对齐要求非常严格,比如sparc系统,如果取未对齐的数据会发生错误,举个例:
char ch[];
char *p = &ch[];
int i = *(int *)p;
运行时会报segment error,而在x86上就不会出现错误,只是效率下降。
3.3 正确处理字节对齐
对于标准数据类型,它的地址只要是它的长度的整数倍就行了,而非标准数据类型按下面的原则对齐:
数组 :按照基本数据类型对齐,第一个对齐了后面的自然也就对齐了。
联合 :按其包含的长度最大的数据类型对齐。
结构体: 结构体中每个数据类型都要对齐。
比如有如下一个结构体:
struct stu{
char sex;
int length;
char name[];
};
struct stu my_stu;
//内存分布图
由于在x86下,GCC默认按4字节对齐,它会在sex后面跟name后面分别填充三个和两个字节使length和整个结构体对齐。于是我们sizeof(my_stu)会得到长度为20,而不是15.
4. sizeof作用于类
C++的类与C的结构体存在着不同,但是同样会涉及到字节对齐的问题,在这方面是相同的,不同之处在于C++的类可以包含成员函数(包括虚函数),数据成员(静态成员)。因此,在sizeof作用于此时也有不同之处!
4.1 空类
当类中什么也不定义时,使用sizeof作用于该类会不会是零呢?
class A
{
}; sizeof(A);
答案是不会,结果是1。很吃惊吧,那么为什么是1呢?
我们简单分析一下:假设结果是0,那么我们定义类A的两个对象a, b时,a 和 b 占用的内存大小也应该是0,那么用什么来标识这两个不同的对象呢?显然没有任何办法。因此,这个假设不成立。
那么就算不是0,为什么是1而不是其他数值呢?例如4。不是要考虑字节对齐吗?这是因为编译器在类中增加了一个字节。字节对齐是在含有数据成员的情况下才发生的事情,因此,在空类情况下不用考虑!
4.1 虚函数内存分布
虚函数的内存分布被陈皓分析的很透彻,可以去看看他的这篇博客!C++ 虚函数表解析。
下面再来看一个例子:
class A
{
public:
A()
{
cout<<"A()"<<endl;
} virtual ~A()
{
cout<<"~A()"<<endl;
}
}; class C
{
public:
C(){
cout<<"C()"<<endl;
} virtual ~C() {
cout<<"~C()"<<endl;
} virtual void getvalue()
{
cout<<"getvalue()"<<endl;
}
};
那么,sizeof(A)、sizeof(C)分别是什么呢?看懂了陈皓上面那篇博客你大概就应该知道了,带有虚函数的类需要用到虚函数表,而虚函数表只需要一个指针指向就OK了!因此,两者均为4
4.2 数据成员内存分布
同样,陈皓两篇文章很好地分析了对象的内存布局,分别是:C++ 对象的内存布局(上)、C++ 对象的内存布局(下)。大家可以好好看看牛逼之人是如何分析的。
下面仅举例子说明一下:
class A
{
private:
static int i;
}; class B
{
private:
static int i;
static double d;
int i1;
double d1;
}; class C
{
public:
static void fun()
{
}
};
那么sizeof(A) 和 sizeof(B)、sizeof(C)又是什么呢?答案分别是1、12、1。为什么呢?
sizeof(A)为什么不是4呢?数据成员的类型是int整形啊,怎么就之占一个字节呢?
这是因为,static 数据成员与成员函数都不计算入sizeof中,也就是这两种成员都是不会使得编译器在类中增加什么的。