转 结构体中字节对齐问题(转载)

struct MyStruct

{

double dda1;

char dda;

int type

};

对结构MyStruct采用sizeof会出现什么结果呢?sizeof(MyStruct)为多少呢?也许你会这样求:

sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13

但是当在VC中测试上面结构的大小时,你会发现sizeof(MyStruct)为16。你知道为什么在VC中会得出这样一个结果吗?

其实,这是VC对变量存储的一个特殊处理。为了提高CPU的存储速度,VC对一些变量的起始地址做了“对齐”处理。在默认情况下,VC规定各成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该变量的类型所占用的字节数的倍数。下面列出常用类型的对齐方式(vc6.0,32位系统)。

类型

对齐方式(变量存放的起始地址相对于结构的起始地址的偏移量)

Char

偏移量必须为sizeof(char)即1的倍数

int

偏移量必须为sizeof(int)即4的倍数

float

偏移量必须为sizeof(float)即4的倍数

double

偏移量必须为sizeof(double)即8的倍数

Short

偏移量必须为sizeof(short)即2的倍数

各成员变量在存放的时候根据在结构中出现的顺序依次申请空间,同时按照上面的对齐方式调整位置,空缺的字节VC会自动填充。同时VC为了确保结构的大小为结构的字节边界数(即该结构中占用最大空间的类型所占用的字节数)的倍数,所以在为最后一个成员变量申请空间后,还会根据需要自动填充空缺的字节。

下面用前面的例子来说明VC到底怎么样来存放结构的。

struct MyStruct

{

double dda1;

char dda;

int type

};

为上面的结构分配空间的时候,VC根据成员变量出现的顺序和对齐方式,先为第一个成员dda1分配空间,其起始地址跟结构的起始地址相同(刚好偏移量0刚好为sizeof(double)的倍数),该成员变量占用sizeof(double)=8个字节;接下来为第二个成员dda分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为8,是sizeof(char)的倍数,所以把dda存放在偏移量为8的地方满足对齐方式,该成员变量占用 sizeof(char)=1个字节;接下来为第三个成员type分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为9,不是sizeof (int)=4的倍数,为了满足对齐方式对偏移量的约束问题,VC自动填充3个字节(这三个字节没有放什么东西),这时下一个可以分配的地址对于结构的起始地址的偏移量为12,刚好是sizeof(int)=4的倍数,所以把type存放在偏移量为12的地方,该成员变量占用sizeof(int)=4个字节;这时整个结构的成员变量已经都分配了空间,总的占用的空间大小为:8+1+3+4=16,刚好为结构的字节边界数(即结构中占用最大空间的类型所占用的字节数sizeof(double)=8)的倍数,所以没有空缺的字节需要填充。所以整个结构的大小为:sizeof(MyStruct)=8+1+ 3+4=16,其中有3个字节是VC自动填充的,没有放任何有意义的东西。

下面再举个例子,交换一下上面的MyStruct的成员变量的位置,使它变成下面的情况:

struct MyStruct

{

char dda;

double dda1;  

int type

};

这个结构占用的空间为多大呢?在VC6.0环境下,可以得到sizeof(MyStruc)为24。结合上面提到的分配空间的一些原则,分析下VC怎么样为上面的结构分配空间的。(简单说明)

struct MyStruct

{

char dda;//偏移量为0,满足对齐方式,dda占用1个字节;

double dda1;//下一个可用的地址的偏移量为1,不是sizeof(double)=8的倍数,需要补足7个字节才能使偏移量变为8(满足对齐方式),因此VC自动填充7个字节,dda1存放在偏移量为                    //8 的地址上,它占用8个字节。

int type;//下一个可用的地址的偏移量为16,是sizeof(int)=4的倍数,满足int的对齐方式,所以不需要VC自动填充,type存 放在偏移量为16的地址上,它占用4个字节。

};

所有成员变量都分配了空间,空间总的大小为1+7+8+4=20,不是结构的节边界数(即结构中占用最大空间的类型所占用的字节数sizeof(double)=8)的倍数,所以需要填充4个字节,以满足结构的大小为sizeof(double)=8的倍数。

所以该结构总的大小为:sizeof(MyStruc)为1+7+8+4+4=24。其中总的有7+4=11个字节是VC自动填充的,没有放任何有意义的东西。

VC对结构的存储的特殊处理确实提高CPU存储变量的速度,但是有时候也带来了一些麻烦,我们也屏蔽掉变量默认的对齐方式,自己可以设定变量的对齐方式。

VC 中提供了#pragma pack(n)来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况:第一、如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式,第二、如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数,不用满足默认的对齐方式。结构的总大小也有个约束条件,分下面两种情况:如果n大于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数;

否则必须为n的倍数。下面举例说明其用法。

#pragma pack(push) //保存对齐状态

#pragma pack(4)//设定为4字节对齐

struct test

{

char m1;

double m4;

int m3;

};

#pragma pack(pop)//恢复对齐状态

以上结构的大小为16,下面分析其存储情况,首先为m1分配空间,其偏移量为0,满足我们自己设定的对齐方式(4字节对齐),m1占用1个字节。接着开始为 m4分配空间,这时其偏移量为1,需要补足3个字节,这样使偏移量满足为n=4的倍数(因为sizeof(double)大于n),m4占用8个字节。接着为m3分配空间,这时其偏移量为12,满足为4的倍数,m3占用4个字节。这时已经为所有成员变量分配了空间,共分配了16个字节,满足为n的倍数。如果把上面的#pragma pack(4)改为#pragma pack(16),那么我们可以得到结构的大小为24。(请读者自己分析)

 

问:下面这个结构类型的实例变量占用多少内存:

struct struct1

{

int i;

short j;

char c;

};

我反问:是啥语言啥机器啥编译环境?

他回答说:VC6.0下。

我:内存对齐后占8byte。

他又继续问:如何让它只占7byte?

我的第一反应是使用位段,正准备回答,又感觉不对,位段不能让它不对齐啊。又想了几秒钟,还是不会,只好回他说没玩过……

今天下午去图书馆翻了下《代码优化:有效使用内存》,发现里面提到了两种方法:

法1:

#pragma pack(push)

#pragma pack(1)

struct struct1

{

int i;

short j;

char c;

};

#pragma pack(pop)

法2:

修改编译指令的参数,来禁止内存对齐:

VC++ :/Zn1(VS2005下,右击项目-属性-配置属性-C/C++-代码生成-结构成员对齐-选“1字节(/Zn1):”(即禁止内存对齐),默认是使用默认值,即按照结构中占用空间最大的成员进行对齐。的size进行对齐。

Borland C++ : /-a1

法2是对整个项目禁用内存对齐,而法1可以针对特定的结构禁用内存对齐,其提供了更大的灵活性.

另外,该书中还提到:

char不对齐;

short沿偶地址对齐;

int/float沿取值为4的倍数的地址对齐。

double沿取值为8的倍数的地址对齐。

VS2005下,默认是使用默认值,即按照结构中占用空间最大的成员进行对齐,我们可以测试下面这个结构:

struct struct2

{

char i;

short d;

double c;

short j;

};

//保持为默认值或修改编译参数/Zn?,猜下sizeof结果为多少?:)

printf("struct2:%d/n",sizeof(struct2));

struct2 st;

printf("%p/n",&st.i);

printf("%p/n",&st.d);

printf("%p/n",&st.c);

printf("%p/n",&st.j);

 

补充:数据的手工对齐:

char *p;

int temp = align_power-1;

p=(char*)malloc(need_size + temp;

p=(char*)malloc(((int)p+temp)&temp);//修改了p,所以释放p前记得要归位

注:align_power是所需要的对齐幂,char*(也可以为int*)是指针类型。另外,释放p之前记得让其指向所申请的内存的首地址上。

 

关于struct结构中字节对齐的问题

2009-04-09 11:03

 

 

什么是对齐,以及为什么要对齐:

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。

对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。其他平台可能没有这种情况, 但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为 32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出,而如果存放在奇地址开始的地方,就可能会需要2个读周期,并对两次读出的结果的高低 字节进行拼凑才能得到该int数据。显然在读取效

率上下降很多。这也是空间和时间的博弈。

对齐的实现

通常,我们写程序的时候,不需要考虑对齐问题。编译器会替我们选择适合目标平台的对齐策略。当然,我们也可以通知给编译器传递预编译指令而改变对指定数据的对齐方法。

但是,正因为我们一般不需要关心这个问题,所以因为编辑器对数据存放做了对齐,而我们不了解的话,常常会对一些问题感到迷惑。最常见的就是struct数据结构的sizeof结果,出乎意料。为此,我们需要对对齐算法所了解。

对齐的算法:

由于各个平台和编译器的不同,现以本人使用的gcc version 3.2.2编译器(32位x86平台)为例子,来讨论编译器对struct数据结构中的各成员如何进行对齐的。

设结构体如下定义:

struct A

{

int a;

char b;

short c;

};

结构体A中包含了4字节长度的int一个,1字节长度的char一个和2字节长度的short型数据一个。所以A用到的空间应该是7字节。但是因为编译器要对数据成员在空间上进行对齐。

所以使用sizeof(strcut A)值为8。

现在把该结构体调整成员变量的顺序。

struct B

{

char b;

int a;

short c;

};

这时候同样是总共7个字节的变量,但是sizeof(struct B)的值却是12。

下面我们使用预编译指令#progma pack (value)来告诉编译器,使用我们指定的对齐值来取代缺省的。

#progma pack (2) /*指定按2字节对齐*/

struct C

{

char b;

int a;

short c;

};

#progma pack () /*取消指定对齐,恢复缺省对齐*/

sizeof(struct C)值是8。

修改对齐值为1:

#progma pack (1) /*指定按1字节对齐*/

struct D

{

char b;

int a;

short c;

};

#progma pack () /*取消指定对齐,恢复缺省对齐*/

sizeof(struct D)值为7。

对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,单位字节。

这里面有四个概念值:

1.数据类型自身的对齐值:就是上面交代的基本数据类型的自身对齐值。

2.指定对齐值:#progma pack (value)时的指定对齐值value。

3.结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。

4.数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。

有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,就 是表示“对齐在N上”,也就是说该数据的"存放起始地址%N=0".而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是 数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值的整 数倍,结合下面例子理解)。这样就不能理解上面的几个例子的值了。

例子分析:

分析例子B;

struct B

{

char b;

int a;

short c;

};

假设B从地址空间0x0000开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为4。第一个成员变量b的自身对齐值是1,比指定或者默认指 定对齐值4小,所以其有效对齐值为1,所以其存放地址0x0000符合0x0000%1=0.第二个成员变量a,其自身对齐值为4,所以有效对齐值也为 4,所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中,复核0x0004%4=0,且紧靠第一个变量。第三个变量c,自身对齐 值为2,所以有效对齐值也是2,可以存放在0x0008到0x0009这两个字节空间中,符合0x0008%2=0。所以从0x0000到0x0009存 放的都是B内容。再看数据结构B的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要 求,0x0009到0x0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体B所占用。故B从0x0000到 0x000B共有12个字节,sizeof(struct B)=12;

同理,分析上面例子C:

#progma pack (2) /*指定按2字节对齐*/

struct C

{

char b;

int a;

short c;

};

#progma pack () /*取消指定对齐,恢复缺省对齐*/

第一个变量b的自身对齐值为1,指定对齐值为2,所以,其有效对齐值为1,假设C从0x0000开始,那么b存放在0x0000,符合 0x0000%1=0;第二个变量,自身对齐值为4,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003、0x0004、 0x0005四个连续字节中,符合0x0002%2=0。第三个变量c的自身对齐值为2,所以有效对齐值为2,顺序存放

在0x0006、0x0007中,符合0x0006%2=0。所以从0x0000到0x00007共八字节存放的是C的变量。又C的自身对齐值为4,所以 C的有效对齐值为2。又8%2=0,C只占用0x0000到0x0007的八个字节。所以sizeof(struct C)=8.

 

 

 

VC中下面几个结构体大小分别是多少呢   

struct MyStruct   

{   

double m4;   

char m1;   

int m3;   

};   

struct MyStruct

{   

char m1;   

double m4;    

int m3;   };   

#pragma pack(push)//保存对齐状态   

#pragma pack(16) //设置为16字节对齐   

struct test   

{   

char m1;   

int m3;   

double m4;   

};      

#pragma pack(pop)//恢复对齐状态

如果你的答案不是16,24和16,相信下面的内容对你很有帮助。   

1、 sizeof应用在结构上的情况   

请看下面的结构:   

struct MyStruct   

{   

double dda1;   

char dda;   

int type   

};   

对结构MyStruct采用sizeof会出现什么结果呢?sizeof(MyStruct)为多少呢?也许你 会这样求:   

sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13   

但是当在VC中测试上面结构的大小时,你会发现sizeof(MyStruct)为16。你知道为什 么在VC中会得出这样一个结果吗?   

其实,这是VC对变量存储的一个特殊处理。为了提高CPU的存储速度,VC对一些变量的 起始地址做了“对齐”处理。在默认情况下,VC规定各成员变量存放的起始地址相对于结 构的起始地址的偏移量必须为该变量的类型所占用的字节数的倍数。下面列出常用类型的 对齐方式(vc6.0,32位系统)。   

类型 对齐方式(变量存放的起始地址相对于结构的起始地址的偏移量)   

Char 偏移量必须为sizeof(char)即1的倍数   

Short 偏移量必须为sizeof(short)即2的倍数   

int   偏移量必须为sizeof(int)即4的倍数   

float   偏移量必须为sizeof(float)即4的倍数   

double   偏移量必须为sizeof(double)即8的倍数   

各成员变量在存放的时候根据在结构中出现的顺序依次申请空间,同时按照上面的对 齐方式调整位置,空缺的字节VC会自动填充。同时VC为了确保结构的大小为结构的字节边 界数(即该结构中占用最大空间的类型所占用的字节数)的倍数,所以在为最后一个成员 变量申请空间后,还会根据需要自动填充空缺的字节。   

下面用前面的例子来说明VC到底怎么样来存放结构的。   

struct MyStruct   

{   

double dda1;   

char dda;   

int type   

};   

为上面的结构分配空间的时候,VC根据成员变量出现的顺序和对齐方式,先为第一个 成员dda1分配空间,其起始地址跟结构的起始地址相同(刚好偏移量0刚好为sizeof(doub le)的倍数),该成员变量占用sizeof(double)=8个字节;接下来为第二个成员dda分配空 间,这时下一个可以分配的地址对于结构的起始地址的偏移量为8,是sizeof(char)的倍数 ,所以把dda存放在偏移量为8的地方满足对齐方式,该成员变量占用 sizeof(char)=1个字 节;接下来为第三个成员type分配空间,这时下一个可以分配的地址对于结构的起始地址 的偏移量为9,不是sizeof (int)=4的倍数,为了满足对齐方式对偏移量的约束问题,VC自 动填充3个字节(这三个字节没有放什么东西),这时下一个可以分配的地址对于结构的起 始地址的偏移量为12,刚好是sizeof(int)=4的倍数,所以把type存放在偏移量为12的地方 ,该成员变量占用sizeof(int)=4个字节;这时整个结构的成员变量已经都分配了空间,总 的占用的空间大小为:8+1+3+4=16,刚好为结构的字节边界数(即结构中占用最大空间的 类型所占用的字节数sizeof(double)=8)的倍数,所以没有空缺的字节需要填充。所以整 个结构的大小为:sizeof(MyStruct)=8+1+ 3+4=16,其中有3个字节是VC自动填充的,没有 放任何有意义的东西。   

下面再举个例子,交换一下上面的MyStruct的成员变量的位置,使它变成下面的情况 :   

struct MyStruct   

{   

char dda;   

double dda1;   

int type   

};   

这个结构占用的空间为多大呢?在VC6.0环境下,可以得到sizeof(MyStruc)为24。结 合上面提到的分配空间的一些原则,分析下VC怎么样为上面的结构分配空间的。(简单说 明)   struct MyStruct   

{   

char dda;//偏移量为0,满足对齐方式,dda占用1个字节;   

double dda1;//下一个可用的地址的偏移量为1,不是sizeof(double)=8的倍数,需要补足7个字节才能使偏移量变为8(满足对齐方式),因此VC自动填充7个字节,dda1存放在偏移量为8 的地址上,它占用8个节。   

int type;//下一个可用的地址的偏移量为16,是sizeof(int)=4的倍数,满足int的对齐方式,所以不需要VC自动填充,type存 放在偏移量为16的地址上,它占用4个字节。   

};

所有成员变量都分配了空间,空间总的大小为1+7+8+4=20,不是结构的节边界数(即结构中占用最大空间的类型所占用的字节数sizeof(double)=8)的倍数,所以需要填充4个字节,以满足结构的大小为sizeof(double)=8的倍数。   

所以该结构总的大小为:sizeof(MyStruc)为1+7+8+4+4=24。其中总的有7+4=11个字节 是VC自动填充的,没有放任何有意义的东西。   

VC对结构的存储的特殊处理确实提高CPU存储变量的速度,但是有时候也带来了一些麻 烦,我们也屏蔽掉变量默认的对齐方式,自己可以设定变量的对齐方式。   

VC 中提供了#pragma pack(n)来设定变量以n字节对齐方式。n字节对齐就是说变量存 放的起始地址的偏移量有两种情况:第一、如果n大于等于该变量所占用的字节数,那么偏 移量必须满足默认的对齐方式,第二、如果n小于该变量的类型所占用的字节数,那么偏移 量为n的倍数,不用满足默认的对齐方式。结构的总大小也有个约束条件,分下面两种情况 :如果n大于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的 变量占用的空间数的倍数;      

否则必须为n的倍数。下面举例说明其用法。   

#pragma pack(push) //保存对齐状态   

#pragma pack(4)//设定为4字节对齐   

struct test   

{   

char m1;   

double m4;   

int m3;   

};   

#pragma pack(pop)//恢复对齐状态   

以上结构的大小为16,下面分析其存储情况,首先为m1分配空间,其偏移量为0,满足 我们自己设定的对齐方式(4字节对齐),m1占用1个字节。接着开始为 m4分配空间,这时 其偏移量为1,需要补足3个字节,这样使偏移量满足为n=4的倍数(因为sizeof(double)大 于n),m4占用8个字节。接着为m3分配空间,这时其偏移量为12,满足为4的倍数,m3占用 4个字节。这时已经为所有成员变量分配了空间,共分配了16个字节,满足为n的倍数。如 果把上面的#pragma pack(4)改为#pragma pack(16),那么我们可以得到结构的大小为24。 文章出处:http://www.diybl.com/course/3_program/c++/cppjs/2008920/143926.html

转 结构体中字节对齐问题(转载)

上一篇:背书原来是这个意思啊


下一篇:Replication--使用备份初始化订阅--推送订阅