C语言中负数在计算机内部的二进制表示方式(以补码表示负数、整数的范围及所占字节数)

负数在计算机内部的表达

众所周知 在计算机的内部 一切都是二进制
18转换为二进制是00010010
0转换为二进制是00000000

那么 负数该如何表达?

在十进制中 负数用-来表示
在十进制的带有负号的运算中 会先进行数字的运算 然后将负号单独处理
但二进制可以表达的数只有0-255 这是因为只能从00000000-11111111

事实上 在计算机中 二进制使用的是补码的方式来表示负数
补码 即为二进制中的11111111(请注意 并不是作为纯二进制 而是补码 若是纯二进制那么就是255了)

由于十进制的0转换为二进制是00000000 十进制的1转换为二进制是00000001
那么 十进制的 -1+1=0 换成二进制的话 那就是11111111+00000001=100000000(多出一位去除)=00000000

二进制的11111111 作为补码 即为 -1
因此 二进制的11111111 有了【两重身份】 既是补码 又是255

补码

对于一个十进制的数 -a
那么 它的补码就是0-a

但在二进制中 实际上是2^n-a(n为a的类型的位数)
举个栗子 若为八位数 那么2^8=256 二进制最多只能表示255 那么256即为100000000
100000000-a之后得到的结果 即为补码

画个草图 以十进制的3为例:
C语言中负数在计算机内部的二进制表示方式(以补码表示负数、整数的范围及所占字节数)
将补码和原码相加之后 可以得到溢出的0

整数的范围

对于8位的二进制数 从00000000 - 11111111

其中:

  • 00000000表示十进制的0
  • 11111111 ~ 10000000表示十进制的 -1 ~ -127
  • 00000001 ~ 01111111表示十进制的 1 ~ 127

我们发现一个特征:负数的最高位(也就是最左边)为1 而正数的最高位为0

对于一个字节 比如11111111
将它以二进制的形式看待 那就是255
但是 若以整数(char)看待 那就是-1

下面以一个小例子来演示:

char c=255;
int i=255;
printf("c=%d,i=%d",c,i); // c=-1,i=255

(它们是不一样的)

这是因为 在int中 数据是32bit的 即 有4组8位bit
以上面的代码为例 变量c里就是11111111 最高位为1 因此是负数
而变量i里就是00000000 00000000 00000000 11111111 最高位为0 因此是正数

在C中 不同的整数有不同的大小:

所占字节数:

正数永远比负数少一个的原因是 在整数中不仅仅只有正数和负数 还有个0
而0的二进制是00000000 最高位也是为0(我们知道最高位为0的是正数)
但关键来了 十进制的0却并不是正数 因此它在二进制中占据了正数的一个名额(相当于是凑热闹的

上一篇:springboot 事务创建流程源码分析


下一篇:对象的内存布局