[大数据量]java移位运算与位运算与数据类型的存储

2021-10-30 22:07:33

站在巨人的肩膀上，参考其他博客文章，汇总于此：

1G=1024M=1024K=1024BYTE=8BIT

Java数据类型的存储：（举例说明）

问：int 型的在内存中怎么存储，假设 int a＝21；那么a是怎么被存到计算机里的。怎样把 a 变成二进制数。
怎么样把  a 存到  byte[]数组中？

答：int占4个字节，byte是1个字节，每个字节8位。
所以2进制的话，int最多可以表示正负一共2的32次方个数，byte则是2的8次方。

e.g.

int=21;在计算机中表示为00000000，00000000，00000000，00010101
byte=21;就是00010101
byte转换int直接赋值，int转byte强制类型转换，因为涉及精度。

移位运算符就是在二进制的基础上对数字进行平移。按照平移的方向和填充数字的规则分为三种：<<（左移）、>>（带符号右移）和>>>（无符号右移）。
　　在移位运算时，byte、short和char类型移位后的结果会变成int类型，对于byte、short、char和int进行移位时，规定实际移动的次数是移动次数和32的余数，也就是移位33次和移位1次得到的结果相同。移动long型的数值时，规定实际移动的次数是移动次数和64的余数，也就是移动66次和移动2次得到的结果相同。

    示例：

System.out.println(11<<2);
    System.out.println(11<<34);
		
    System.out.println(1111111111111111111L>>>2);
    System.out.println(1111111111111111111L>>>66);

结果：

 44
    44
    277777777777777777
    277777777777777777

　　三种移位运算符的移动规则和使用如下所示：
　　<<运算规则：按二进制形式把所有的数字向左移动对应的位数，高位移出（舍弃），低位的空位补零。
　　语法格式：
　　需要移位的数字 << 移位的次数
　　例如： 3 << 2，则是将数字3左移2位
　　计算过程：
　　3 << 2
　　首先把3转换为二进制数字0000 0000 0000 0000 0000 0000 0000 0011，然后把该数字高位（左侧）的两个零移出，其他的数字都朝左平移2位，最后在低位（右侧）的两个空位补零。则得到的最终结果是0000 0000 0000 0000 0000 0000 0000 1100，则转换为十进制是12.数学意义：
　　在数字没有溢出的前提下，对于正数和负数，左移一位都相当于乘以2的1次方，左移n位就相当于乘以2的n次方。
　　>>运算规则：按二进制形式把所有的数字向右移动对应巍峨位数，低位移出（舍弃），高位的空位补符号位，即正数补零，负数补1.
　　语法格式：
　　需要移位的数字 >> 移位的次数
　　例如11 >> 2，则是将数字11右移2位
　　计算过程：11的二进制形式为：0000 0000 0000 0000 0000 0000 0000 1011，然后把低位的最后两个数字移出，因为该数字是正数，所以在高位补零。则得到的最终结果是0000 0000 0000 0000 0000 0000 0000 0010.转换为十进制是2.数学意义：右移一位相当于除2，右移n位相当于除以2的n次方。

     >>>运算规则：按二进制形式把所有的数字向右移动对应巍峨位数，低位移出（舍弃），高位的空位补零。对于正数来说和带符号右移相同，对于负数来说不同。
　　其他结构和>>相似。

    举例：
     byte a = 27;// 转换成int为 00000000000000000000000000011011
     byte b = -1;转换成int为 11111111111111111111111111111111

     g = a >>> 1;// 无符号右移1位，左侧缺的位以0补齐，              "00000000000000000000000000001101" = 13
     f = b>>> 1; // 无符号右移1位，左侧缺的位以0补齐， “01111111111111111111111111111111”=   2147483647

     故此时打印出来，g=13，f=2147483647。
　　小结
　　二进制运算符，包括位运算符和移位运算符，使程序员可以在二进制基础上操作数字，可以更有效的进行运算，并且可以以二进制的形式存储和转换数据，是实现网络协议解析以及加密等算法的基础。
    示例代码

     public class URShift {
	public static void main(String[] args) {
		//int i = -1;
		//i >>>= 10;
		//System.out.println(i);
		mTest();
	}

	public static void mTest() {
		// 左移
		int i = 12; // 二进制为:0000000000000000000000000001100
		i <<= 2; // i左移2位，把高位的两位数字(左侧开始)抛弃,低位的空位补0,二进制码就为0000000000000000000000000110000
		System.out.println(i); // 二进制110000值为48；
		System.out.println("<br>");
		// 右移
		i >>= 2; // i右移2为，把低位的两个数字(右侧开始)抛弃,高位整数补0，负数补1，二进制码就为0000000000000000000000000001100
		System.out.println(i); // 二进制码为1100值为12
		System.out.println("<br>");
		// 右移example
		int j = 11;// 二进制码为00000000000000000000000000001011
		j >>= 2; // 右移两位，抛弃最后两位,整数补0,二进制码为：00000000000000000000000000000010
		System.out.println(j); // 二进制码为10值为2
		System.out.println("<br>");
		byte k = -2; // 转为int,二进制码为：0000000000000000000000000000010
		k >>= 2; // 右移2位，抛弃最后2位，负数补1,二进制吗为：11000000000000000000000000000
		System.out.println(j); // 二进制吗为11值为2
	}
}

ThinkingInJava原话：

在Thinking in Java第三章中的一段话:
　　移位运算符面向的运算对象也是
　　二进制的“位”。 可单独用它们处理整数类型（主类型的一种）。左移位运算符（<<）能将运算符左边的运算对象向左移动运算符右侧指定的位数（在低位补0）。 “有符号”右移位运算符（>>）则将运算符左边的运算对象向右移动运算符右侧指定的位数。“有符号”右移位运算符使用了“符号扩展”：若值为正，则在高位插入0；若值为负，则在高位插入1。Java也添加了一种“无符号”右移位运算符（>>>），它使用了“零扩展”：无论正负，都在高位插入0。这一运算符是C或C++没有的。
　　若对char，byte或者short进行移位处理，那么在移位进行之前，它们会自动转换成一个int。只有右侧的5个低位才会用到。这样可防止我们在一个int数里移动不切实际的位数。若对一个long值进行处理，最后得到的结果也 是long。此时只会用到右侧的6个低位，防止移动超过long值里现成的位数。但在进行“无符号”右移位时，也可能遇到一个问题。若对byte或 short值进行右移位运算，得到的可能不是正确的结果（Java 1.0和Java 1.1特别突出）。它们会自动转换成int类型，并进行右移位。但“零扩展”不会发生，所以在那些情况下会得到-1的结果。

-------------------------------------------------------------------------------

Java位运算

Java 定义的位运算（bitwise operators ）直接对整数类型的位进行操作，这些整数类型包括long，int，short，char，and byte 。表4-2 列出了位运算：
表4.2 位运算符及其结果

运算符 结果 
~ 按位非（NOT）（一元运算） 
& 按位与（AND） 
| 按位或（OR） 
^ 按位异或（XOR） 
>> 右移 
>>> 右移，左边空出的位以0填充 
运算符 结果 
<< 左移 
&= 按位与赋值 
|= 按位或赋值 
^= 按位异或赋值 
>>= 右移赋值 
>>>= 右移赋值，左边空出的位以0填充 
<<= 左移赋值

续表

既然位运算符在整数范围内对位操作，因此理解这样的操作会对一个值产生什么效果是重要的。具体地说，知道Java 是如何存储整数值并且如何表示负数的是有用的。因此，在继续讨论之前，让我们简短概述一下这两个话题。

所有的整数类型以二进制数字位的变化及其宽度来表示。例如，byte 型值42的二进制代码是00101010 ，其中每个位置在此代表2的次方，在最右边的位以20开始。向左下一个位置将是21，或2，依次向左是22，或4，然后是8，16，32等等，依此类推。因此42在其位置1，3，5的值为1（从右边以0开始数）；这样42是21+23+25的和，也即是2+8+32 。

所有的整数类型（除了char 类型之外）都是有符号的整数。这意味着他们既能表示正数，又能表示负数。Java 使用大家知道的2的补码（two’s complement ）这种编码来表示负数，也就是通过将与其对应的正数的二进制代码取反（即将1变成0，将0变成1），然后对其结果加1。例如，-42就是通过将42的二进制代码的各个位取反，即对00101010 取反得到11010101 ，然后再加1，得到11010110 ，即-42 。要对一个负数解码，首先对其所有的位取反，然后加1。例如-42，或11010110 取反后为00101001 ，或41，然后加1，这样就得到了42。

如果考虑到零的交叉（zero crossing ）问题，你就容易理解Java （以及其他绝大多数语言）这样用2的补码的原因。假定byte 类型的值零用00000000 代表。它的补码是仅仅将它的每一位取反，即生成11111111 ，它代表负零。但问题是负零在整数数学中是无效的。为了解决负零的问题，在使用2的补码代表负数的值时，对其值加1。即负零11111111 加1后为100000000 。但这样使1位太靠左而不适合返回到byte 类型的值，因此人们规定，-0和0的表示方法一样，-1的解码为11111111 。尽管我们在这个例子使用了byte 类型的值，但同样的基本的原则也适用于所有Java 的整数类型。

因为Java 使用2的补码来存储负数，并且因为Java 中的所有整数都是有符号的，这样应用位运算符可以容易地达到意想不到的结果。例如，不管你如何打算，Java 用高位来代表负数。为避免这个讨厌的意外，请记住不管高位的顺序如何，它决定一个整数的符号。

4.2.1 位逻辑运算符
位逻辑运算符有“与”（AND）、“或”（OR）、“异或（XOR ）”、“非（NOT）”，分别用“&”、“|”、“^”、“~”表示，4-3 表显示了每个位逻辑运算的结果。在继续讨论之前，请记住位运算符应用于每个运算数内的每个单独的位。
表4-3 位逻辑运算符的结果
A 0 1 0 1 B 0 0 1 1 A | B 0 1 1 1 A & B 0 0 0 1 A ^ B 0 1 1 0 ~A 1 0 1 0

按位非（NOT）

按位非也叫做补，一元运算符NOT“~”是对其运算数的每一位取反。例如，数字42，它的二进制代码为：

00101010

经过按位非运算成为

11010101

按位与（AND）

按位与运算符“&”，如果两个运算数都是1，则结果为1。其他情况下，结果均为零。看下面的例子：

00101010 42 &00001111 15

00001010 10

按位或（OR）

按位或运算符“|”，任何一个运算数为1，则结果为1。如下面的例子所示：

00101010 42 | 00001111 15

00101111 47

按位异或（XOR）

按位异或运算符“^”，只有在两个比较的位不同时其结果是 1。否则，结果是零。下面的例子显示了“^”运算符的效果。这个例子也表明了XOR 运算符的一个有用的属性。注意第二个运算数有数字1的位，42对应二进制代码的对应位是如何被转换的。第二个运算数有数字0的位，第一个运算数对应位的数字不变。当对某些类型进行位运算时，你将会看到这个属性的用处。

00101010 42 ^ 00001111 15

00100101 37
位逻辑运算符的应用

下面的例子说明了位逻辑运算符：

// Demonstrate the bitwise logical operators. 
class BitLogic { 
public static void main(String args[]) { 


String binary[] = {"0000", "0001", "0010", "0011", "0100", "0101", "0110", "0111", "1000", "1001", "1010", "1011", "1100", "1101", "1110", "1111" 

}; 
int a = 3; // 0 + 2 + 1 or 0011 in binary 
int b = 6; // 4 + 2 + 0 or 0110 in binary 
int c = a | b; 
int d = a & b; 
int e = a ^ b; 
int f = (~a & b) | (a & ~b); 
int g = ~a & 0x0f; 


System.out.println(" a = " + binary[a]); 
System.out.println(" b = " + binary[b]); 
System.out.println(" a|b = " + binary[c]); 
System.out.println(" a&b = " + binary[d]); 
System.out.println(" a^b = " + binary[e]); 
System.out.println("~a&b|a&~b = " + binary[f]); 
System.out.println(" ~a = " + binary[g]); 


} 
}

在本例中，变量a与b对应位的组合代表了二进制数所有的 4 种组合模式：0-0，0-1，1-0 ，和1-1 。“|”运算符和“&”运算符分别对变量a与b各个对应位的运算得到了变量c和变量d的值。对变量e和f的赋值说明了“^”运算符的功能。字符串数组binary 代表了0到15 对应的二进制的值。在本例中，数组各元素的排列顺序显示了变量对应值的二进制代码。数组之所以这样构造是因为变量的值n对应的二进制代码可以被正确的存储在数组对应元素binary[n] 中。例如变量a的值为3，则它的二进制代码对应地存储在数组元素binary[3] 中。~a的值与数字0x0f （对应二进制为0000 1111 ）进行按位与运算的目的是减小~a的值，保证变量g的结果小于16。因此该程序的运行结果可以用数组binary 对应的元素来表示。该程序的输出如下：

a = 0011 b = 0110 a|b = 0111 a&b = 0010 a^b = 0101 ~a&b|a&~b = 0101 ~a = 1100

4.2.2 左移运算符
左移运算符<<使指定值的所有位都左移规定的次数。它的通用格式如下所示：

value << num
这里，num 指定要移位值value 移动的位数。也就是，左移运算符<<使指定值的所有位都左移num位。每左移一个位，高阶位都被移出（并且丢弃），并用0填充右边。这意味着当左移的运算数是int 类型时，每移动1位它的第31位就要被移出并且丢弃；当左移的运算数是long 类型时，每移动1位它的第63位就要被移出并且丢弃。

在对byte 和short类型的值进行移位运算时，你必须小心。因为你知道Java 在对表达式求值时，将自动把这些类型扩大为 int 型，而且，表达式的值也是int 型。对byte 和short类型的值进行移位运算的结果是int 型，而且如果左移不超过31位，原来对应各位的值也不会丢弃。但是，如果你对一个负的byte 或者short类型的值进行移位运算，它被扩大为int 型后，它的符号也被扩展。这样，整数值结果的高位就会被1填充。因此，为了得到正确的结果，你就要舍弃得到结果的高位。这样做的最简单办法是将结果转换为byte 型。下面的程序说明了这一点：

// Left shifting a byte value. 
class ByteShift { 


public static void main(String args[]) { 
byte a = 64, b; 
int i; 


i = a << 2; 
b = (byte) (a << 2); 


System.out.println("Original value of a: " + a); 
System.out.println("i and b: " + i + " " + b); 
} 
}

该程序产生的输出下所示：

Original value of a: 64 
i and b: 256 0

因变量a在赋值表达式中，故被扩大为int 型，64（0100 0000 ）被左移两次生成值256 （10000 0000 ）被赋给变量i。然而，经过左移后，变量b中惟一的1被移出，低位全部成了0，因此b的值也变成了0。

既然每次左移都可以使原来的操作数翻倍，程序员们经常使用这个办法来进行快速的2 的乘法。但是你要小心，如果你将1移进高阶位（31或63位），那么该值将变为负值。下面的程序说明了这一点：

// Left shifting as a quick way to multiply by 2. 
class MultByTwo { 


public static void main(String args[]) { 
int i; 
int num = 0xFFFFFFE; 


for(i=0; i<4; i++) { 
num = num << 1; 
System.out.println(num); 


} 
}

这里，num 指定要移位值value 移动的位数。也就是，左移运算符<<使指定值的所有位都左移num位。每左移一个位，高阶位都被移出（并且丢弃），并用0填充右边。这意味着当左移的运算数是int 类型时，每移动1位它的第31位就要被移出并且丢弃；当左移的运算数是long 类型时，每移动1位它的第63位就要被移出并且丢弃。

在对byte 和short类型的值进行移位运算时，你必须小心。因为你知道Java 在对表达式求值时，将自动把这些类型扩大为 int 型，而且，表达式的值也是int 型。对byte 和short类型的值进行移位运算的结果是int 型，而且如果左移不超过31位，原来对应各位的值也不会丢弃。但是，如果你对一个负的byte 或者short类型的值进行移位运算，它被扩大为int 型后，它的符号也被扩展。这样，整数值结果的高位就会被1填充。因此，为了得到正确的结果，你就要舍弃得到结果的高位。这样做的最简单办法是将结果转换为byte 型。下面的程序说明了这一点：

// Left shifting a byte value. 
class ByteShift { 


public static void main(String args[]) { 
byte a = 64, b; 
int i; 


i = a << 2; 
b = (byte) (a << 2); 


System.out.println("Original value of a: " + a); 
System.out.println("i and b: " + i + " " + b); 
} 
}

该程序产生的输出下所示：

Original value of a: 64 
i and b: 256 0

// Left shifting as a quick way to multiply by 2. 
class MultByTwo { 


public static void main(String args[]) { 
int i; 
int num = 0xFFFFFFE; 


for(i=0; i<4; i++) { 
num = num << 1; 
System.out.println(num); 


} 
} 
}

该程序的输出如下所示：

初值经过仔细选择，以便在左移 4 位后，它会产生-32。正如你看到的，当1被移进31 位时，数字被解释为负值。

4.2.3 右移运算符
右移运算符>>使指定值的所有位都右移规定的次数。它的通用格式如下所示：

value >> num

这里，num 指定要移位值value 移动的位数。也就是，右移运算符>>使指定值的所有位都右移num位。下面的程序片段将值32右移2次，将结果8赋给变量a:

int a = 32;
a = a >> 2; // a now contains 8

当值中的某些位被“移出”时，这些位的值将丢弃。例如，下面的程序片段将35右移2 次，它的2个低位被移出丢弃，也将结果8赋给变量a:

int a = 35;
a = a >> 2; // a still contains 8

用二进制表示该过程可以更清楚地看到程序的运行过程：

00100011 35
>> 2
00001000 8

将值每右移一次，就相当于将该值除以2并且舍弃了余数。你可以利用这个特点将一个整数进行快速的2的除法。当然，你一定要确保你不会将该数原有的任何一位移出。

右移时，被移走的最高位（最左边的位）由原来最高位的数字补充。例如，如果要移走的值为负数，每一次右移都在左边补1，如果要移走的值为正数，每一次右移都在左边补0，这叫做符号位扩展（保留符号位）（sign extension ），在进行右移操作时用来保持负数的符号。例如，–8 >> 1 是–4，用二进制表示如下：

11111000 –8 >>1 11111100 –4

一个要注意的有趣问题是，由于符号位扩展（保留符号位）每次都会在高位补1，因此-1右移的结果总是–1。有时你不希望在右移时保留符号。例如，下面的例子将一个byte 型的值转换为用十六
进制表示。注意右移后的值与0x0f进行按位与运算，这样可以舍弃任何的符号位扩展，以便得到的值可以作为定义数组的下标，从而得到对应数组元素代表的十六进制字符。

// Masking sign extension. 
class HexByte { 
static public void main(String args[]) { 

char hex[] = { 
’0’, ’1’, ’2’, ’3’, ’4’, ’5’, ’6’, ’7’, 
’8’, ’9’, ’a’, ’b’, ’c’, ’d’, ’e’, ’f’’ 
}; 
byte b = (byte) 0xf1; 

System.out.println("b = 0x" + hex[(b >> 4) & 0x0f] + hex[b & 0x0f]);}}

该程序的输出如下：

b = 0xf1

4.2.4 无符号右移
正如上面刚刚看到的，每一次右移，>>运算符总是自动地用它的先前最高位的内容补它的最高位。这样做保留了原值的符号。但有时这并不是我们想要的。例如，如果你进行移位操作的运算数不是数字值，你就不希望进行符号位扩展（保留符号位）。当你处理像素值或图形时，这种情况是相当普遍的。在这种情况下，不管运算数的初值是什么，你希望移位后总是在高位（最左边）补0。这就是人们所说的无符号移动（unsigned shift ）。这时你可以使用Java 的无符号右移运算符>>> ，它总是在左边补0。

下面的程序段说明了无符号右移运算符>>> 。在本例中，变量a被赋值为-1，用二进制表示就是32位全是1。这个值然后被无符号右移24位，当然它忽略了符号位扩展，在它的左边总是补0。这样得到的值255被赋给变量a。

int a = -1; a = a >>> 24;

下面用二进制形式进一步说明该操作：

11111111 11111111 11111111 11111111 int型-1的二进制代码>>> 24 无符号右移24位00000000 00000000 00000000 11111111 int型255的二进制代码

由于无符号右移运算符>>> 只是对32位和64位的值有意义，所以它并不像你想象的那样有用。因为你要记住，在表达式中过小的值总是被自动扩大为int 型。这意味着符号位扩展和移动总是发生在32位而不是8位或16位。这样，对第7位以0开始的byte 型的值进行无符号移动是不可能的，因为在实际移动运算时，是对扩大后的32位值进行操作。下面的例子说明了这一点：

// Unsigned shifting a byte value.
class ByteUShift {
static public void main(String args[]) {

进制表示。注意右移后的值与0x0f进行按位与运算，这样可以舍弃任何的符号位扩展，以便得到的值可以作为定义数组的下标，从而得到对应数组元素代表的十六进制字符。

// Masking sign extension.

class HexByte { 
static public void main(String args[]) { 

char hex[] = { 
’0’, ’1’, ’2’, ’3’, ’4’, ’5’, ’6’, ’7’, 
’8’, ’9’, ’a’, ’b’, ’c’, ’d’, ’e’, ’f’’ 
}; 
byte b = (byte) 0xf1; 

System.out.println("b = 0x" + hex[(b >> 4) & 0x0f] + hex[b & 0x0f]);}}

该程序的输出如下：

b = 0xf1

class ByteUShift { 
static public void main(String args[]) { 
int b = 2; 
int c = 3; 

a |= 4; 
b >>= 1; 
c <<= 1; 
a ^= c; 
System.out.println("a = " + a); 
System.out.println("b = " + b); 
System.out.println("c = " + c); 
} 
}

该程序的输出如下所示：

a = 3 
b = 1 
c = 6

码农公寓

相关文章