题外话:如有误,请留言通知我。
大小端,是数值在内存中的排列方式:数值的高低位与内存地址的大小 的关系。
大/小端,英文Big/Little Endian。
注意:endian,就是字节序、字节存储顺序的意思,也有尾数的意思。这里取尾数的含义刚刚好,原因如下。
先说一个前提:内存地址的前xx位通常是系统保留区,用于运行内核程序。所以用户程序就从另一端开始占用 --- 这就是为什么用户程序是从高位地址开始往低位地址伸展。(另一种可能本文不考虑)
在上面的前提下,我们已知int类型的长度是4 bytes,就是说它需要占用4 bytes的内存空间。
那么,它是如何占用的呢?
以 int i = 0x12345678; (见附注)为例说明,可以有两种方式,一种就是12 34 56 78,地址依次减小;另一种则是78 56 34 12,与前面的刚好相反。
两种方式都可以理解。但是,需要记住一点:int的地址永远是低位的(注意前提)。就是说,&i 获取的永远是低位的地址。
那么,第一种方式下,该地址应该是78所在的空间地址;同理,第二中方式下,该地址就是12所在的空间地址!
现在可以继续说尾数(endian)了,0x12345678的尾数自然就是78,该数字所在的端如果是低地址,就是小端对齐,反之,则是大端对齐!
代码验证windows下的大小端对齐方式
#include <stdio.h> //测试大小端对齐
int main(int argc, char const *argv[])
{
int a=0x12345678;
printf("%p, %x\n", &a, a);
char *p=(char *)&a;
char *p2=p;
char *p3=p; //输出大小端
for (int i = ; i < sizeof a; ++i)
{
printf("%p, %x\n", p++, *p);
} //如何反转大小端?
for (int i = ; i < sizeof(a)/; ++i)
{
char tmp=*p2;
*p2 = *(p2+sizeof(a)--*i);
*(p2+sizeof(a)--*i)=tmp;
++p2;
}
printf("after transfer : %p, %x\n", &a, a); for (int i = ; i < sizeof(a)/; ++i)
{
(*p3) ^= (*(p3+sizeof(a)--*i));
(*(p3+sizeof(a)--*i)) ^= (*p3);
(*p3) ^= (*(p3+sizeof(a)--*i));
++p3;
}
printf("after transfer again : %p, %x\n", &a, a); return ;
}
附注:
可能有的人不理解为什么要用这个数,或者说,为什么这个数可以说明问题。
这是基础的东西:
int 是 bytes, byte 是 bits, bits 刚好是一个16进制数字。 int == bytes;
byte == bits;
0x0 ~ 0xF == bits; // ( 0000 ~ 1111 )
byte == 0x00 ~ 0xFF; //( 00000000 ~ 11111111 )
int == 0x00 ~ 0xFF FF FF FF;
所以 1 byte 就是 2 个16进制数字,所以 int 就是 8 个16进制数字!
而为了区别每个byte的内容,将其设为不同的值是最佳选择!