Java二进制和位运算，这一万字准能喂饱你

2021-10-14 03:28:26

基础不牢，地动山摇。本文已被 https://www.yourbatman.cn 收录，里面一并有Spring技术栈、MyBatis、JVM、中间件等小而美的专栏供以免费学习。关注公众号【BAT的乌托邦】逐个击破，深入掌握，拒绝浅尝辄止。

✍前言

你好，我是YourBatman。

本号正在连载Jackson深度解析系列，虽然目前还只讲到了其流式API层面，但已接触到其多个Feature特征。更为重要的是我在文章里赞其设计精妙，处理优雅，因此就有小伙伴私信给我问这样的话：

题外话：Jackson这个话题本就非常小众，看着阅读量我自己都快没信心写下去。但自己说过的话就是欠下的债，熬夜也得把承诺的付费内容给公开完了，毕竟还有那么几个人在白嫖不是????。

话外音：以后闷头做事，少吹牛逼┭┮﹏┭┮

虽然小众，竟然还有想深入了解一波的小伙伴，确实让我为之振奋了那么三秒。既然如此那就干吧，本文就先行来认识认识Java中的位运算。位运算在Java中很少被使用，那么为何Jackson里爱不释手呢？一切就为两字：性能/高效。用计算机能直接看懂的语言跟它打交道，你说快不快，不用多想嘛。

✍正文

提及位运算，对绝大多数Java程序员来说，是一种既熟悉又陌生的感觉。熟悉是因为你在学JavaSE时肯定学过，并且在看一些开源框架（特别是JDK源码）时都能看到它的身影；陌生是因为大概率我们不会去使用它。当然，不能“流行”起来是有原因的：不好理解，不符合人类的思维，阅读性差…...

小贴士：一般来说，程序让人看懂远比被机器看懂来得更重要些

位运算它在low-level的语言里使用得比较多，但是对于Java这种高级语言它就很少被提及了。虽然我们使用得很少但Java也是支持的，毕竟很多时候使用位运算才是最佳实践。

位运算在日常开发中使用得较少，但是巧妙的使用位运算可以大量减少运行开销，优化算法。一条语句可能对代码没什么影响，但是在高重复，大数据量的情况下将会节省很多开销。

二进制

在了解什么是位运算之前，十分有必要先科普下二进制的概念。

二进制是计算技术中广泛采用的一种数制。二进制数据是用0和1两个数码来表示的数。它的基数为2，进位规则是逢二进一，借位规则是借一当二。因为它只使用0、1两个数字符号，非常简单方便，易于用电子方式实现。

小贴士：半导体开代表1，关代表0，这也就是CPU计算的最底层原理????

先看一个例子：

求 1011（二进制）+ 11（二进制） 的和？
结果为：1110（二进制）

二进制理解起来非常非常的简单，比10进制简单多了。你可能还会思考二进制怎么和十进制互转呢？毕竟1110这个也看不到啊。有或者往深了继续思考：如何转为八进制、十六进制、三十二进制......进制转换并非本文所想讲述的内容，请有兴趣者自行度娘。

二进制与编码

这个虽然和本文内容关联系并不是很大，但顺带捞一捞，毕竟编码问题在开发中还是比较常见的。

计算机能识别的只有1和0，也就是二进制，1和0可以表达出全世界的所有文字和语言符号。那如何表达文字和符号呢？这就涉及到字符编码了。字符编码强行将每一个字符对应一个十进制数字（请注意字符和数字的区别，比如0字符对应的十进制数字是48），再将十进制数字转换成计算机理解的二进制，而计算机读到这些1和0之后就会显示出对应的文字或符号。

一般对英文字符而言，一个字节表示一个字符，但是对汉字而言，由于低位的编码已经被使用(早期计算机并不支持中文，因此为了扩展支持，唯一的办法就是采用更多的字节数)只好向高位扩展
字符集编码的范围utf-8>gbk>iso-8859-1(latin1)>ascll。ascll编码是美国标准信息交换码的英文缩写，包含了常用的字符，如阿拉伯数字，英文字母和一些打印符号共255个（一般说成共128个字符问题也不大）

UTF-8：一套以 8 位为一个编码单位的可变长编码，会将一个码位（Unicode）编码为1到4个字节（英文1字节，大部分汉字3字节）。

Java中的二进制

在Java7版本以前，Java是不支持直接书写除十进制以外的其它进制字面量。但这在Java7以及以后版本就允许了：

二进制：前置0b/0B
八进制：前置0
十进制：默认的，无需前置
十六进制：前置0x/0X

@Test
public void test1() {
    //二进制
    int i = 0B101;
    System.out.println(i); //5
    System.out.println(Integer.toBinaryString(i));
    //八进制
    i = 0101;
    System.out.println(i); //65
    System.out.println(Integer.toBinaryString(i));
    //十进制
    i = 101;
    System.out.println(i); //101
    System.out.println(Integer.toBinaryString(i));
    //十六进制
    i = 0x101;
    System.out.println(i); //257
    System.out.println(Integer.toBinaryString(i));
}

结果程序，输出：

说明：System.out.println()会先自动转为10进制后再输出的；toBinaryString()表示转换为二进制进行字符串进行输出。

便捷的进制转换API

JDK自1.0开始便提供了非常便捷的进制转换的API，这在我们有需要时非常有用。

@Test
public void test2() {
    int i = 192;
    System.out.println("---------------------------------");
    System.out.println("十进制转二进制：" + Integer.toBinaryString(i)); //11000000
    System.out.println("十进制转八进制：" + Integer.toOctalString(i)); //300
    System.out.println("十进制转十六进制：" + Integer.toHexString(i)); //c0
    System.out.println("---------------------------------");
    // 统一利用的为Integer的valueOf()方法,parseInt方法也是ok的
    System.out.println("二进制转十进制：" + Integer.valueOf("11000000", 2).toString()); //192
    System.out.println("八进制转十进制：" + Integer.valueOf("300", 8).toString()); //192
    System.out.println("十六进制转十进制：" + Integer.valueOf("c0", 16).toString()); //192
    System.out.println("---------------------------------");
}

运行程序，输出：

---------------------------------
十进制转二进制：11000000
十进制转八进制：300
十进制转十六进制：c0
---------------------------------
二进制转十进制：192
八进制转十进制：192
十六进制转十进制：192
---------------------------------

如何证明Long是64位的？

我相信每个Javaer都知道Java中的Long类型占8个字节（64位），那如何证明呢？

小贴士：这算是一道经典面试题，至少我提问过多次~

有个最简单的方法：拿到Long类型的最大值，用2进制表示转换成字符串看看长度就行了，代码如下：

@Test
public void test3() {
    long l = 100L;
    //如果不是最大值 前面都是0  输出的时候就不会有那么长了（所以下面使用最大/最小值示例）
    System.out.println(Long.toBinaryString(l)); //1100100
    System.out.println(Long.toBinaryString(l).length()); //7

    System.out.println("---------------------------------------");

    l = Long.MAX_VALUE; // 2的63次方 - 1
    //正数长度为63为（首位为符号位，0代表正数，省略了所以长度是63）
    //111111111111111111111111111111111111111111111111111111111111111
    System.out.println(Long.toBinaryString(l));
    System.out.println(Long.toBinaryString(l).length()); //63

    System.out.println("---------------------------------------");

    l = Long.MIN_VALUE; // -2的63次方
    //负数长度为64位（首位为符号位，1代表负数）
    //1000000000000000000000000000000000000000000000000000000000000000
    System.out.println(Long.toBinaryString(l));
    System.out.println(Long.toBinaryString(l).length()); //64
}

运行程序，输出：

1100100
7
---------------------------------------
111111111111111111111111111111111111111111111111111111111111111
63
---------------------------------------
1000000000000000000000000000000000000000000000000000000000000000
64

说明：在计算机中，负数以其正值的补码的形式表达。因此，用同样的方法你可以自行证明Integer类型是32位的（占4个字节）。

Java中的位运算

Java语言支持的位运算符还是非常多的，列出如下：

&：按位与
|：按位或
^：按位异或
<<：左位移运算符
>>：右位移运算符
>>>：无符号右移运算符

除～以外，其余均为二元运算符，操作的数据只能是整型（长短均可）或者char字符型。针对这些运算类型，下面分别给出示例，一目了然。

既然是运算，依旧可以分为简单运算和复合运算两大类进行归类和讲解。

小贴士：为了便于理解，字面量例子我就都使用二进制表示了，使用十进制（任何进制）不影响运算结果

简单运算

简单运算，顾名思义，一次只用一个运算符。

&：按位与

操作规则：同为1则1，否则为0。仅当两个操作数都为1时，输出结果才为1，否则为0。

说明：1、本示例（下同）中所有的字面值使用的都是十进制表示的，理解的时候请用二进制思维去理解；2、关于负数之间的位运算本文章统一不做讲述

@Test
public void test() {
    int i = 0B100; // 十进制为4
    int j = 0B101; // 十进制为5

    // 二进制结果：100
    // 十进制结果：4
    System.out.println("二进制结果：" + Integer.toBinaryString(i & j));
    System.out.println("十进制结果：" + (i & j));
}

|：按位或

操作规则：同为0则0，否则为1。仅当两个操作数都为0时，输出的结果才为0。

@Test
public void test() {
    int i = 0B100; // 十进制为4
    int j = 0B101; // 十进制为5

    // 二进制结果：101
    // 十进制结果：5
    System.out.println("二进制结果：" + Integer.toBinaryString(i | j));
    System.out.println("十进制结果：" + (i | j));
}

~：按位非

操作规则：0为1，1为0。全部的0置为1，1置为0。

小贴士：请务必注意是全部的，别忽略了正数前面的那些0哦~

@Test
public void test() {
    int i = 0B100; // 十进制为4

    // 二进制结果：11111111111111111111111111111011
    // 十进制结果：-5
    System.out.println("二进制结果：" + Integer.toBinaryString(~i));
    System.out.println("十进制结果：" + (~i));
}

^：按位异或

操作规则：相同为0，不同为1。操作数不同时（1遇上0，0遇上1）对应的输出结果才为1，否则为0。

@Test
public void test() {
    int i = 0B100; // 十进制为4
    int j = 0B101; // 十进制为5

    // 二进制结果：1
    // 十进制结果：1
    System.out.println("二进制结果：" + Integer.toBinaryString(i ^ j));
    System.out.println("十进制结果：" + (i ^ j));
}

<<：按位左移

操作规则：把一个数的全部位数都向左移动若干位。

@Test
public void test() {
    int i = 0B100; // 十进制为4

    // 二进制结果：100000
    // 十进制结果：32 = 4 * (2的3次方)
    System.out.println("二进制结果：" + Integer.toBinaryString(i << 2));
    System.out.println("十进制结果：" + (i << 3));
}

左移用得非常多，理解起来并不费劲。x左移N位，效果同十进制里直接乘以2的N次方就行了，但是需要注意值溢出的情况，使用时稍加注意。

>>：按位右移

操作规则：把一个数的全部位数都向右移动若干位。

@Test
public void test() {
    int i = 0B100; // 十进制为4

    // 二进制结果：10
    // 十进制结果：2
    System.out.println("二进制结果：" + Integer.toBinaryString(i >> 1));
    System.out.println("十进制结果：" + (i >> 1));
}

负数右移：

@Test
public void test() {
    int i = -0B100; // 十进制为-4

    // 二进制结果：11111111111111111111111111111110
    // 十进制结果：-2
    System.out.println("二进制结果：" + Integer.toBinaryString(i >> 1));
    System.out.println("十进制结果：" + (i >> 1));
}

右移用得也比较多，也比较理解：操作其实就是把二进制数右边的N位直接砍掉，然后正数右移高位补0，负数右移高位补1。

>>>：无符号右移

注意：没有无符号左移，并没有<<<这个符号的

它和>>有符号右移的区别是：无论是正数还是负数，高位通通补0。所以说对于正数而言，没有区别；那么看看对于负数的表现：

@Test
public void test() {
    int i = -0B100; // 十进制为-4

    // 二进制结果：11111111111111111111111111111110（>>的结果）
    // 二进制结果：1111111111111111111111111111110（>>>的结果）
    // 十进制结果：2147483646
    System.out.println("二进制结果：" + Integer.toBinaryString(i >>> 1));
    System.out.println("十进制结果：" + (i >>> 1));
}

我特意把>>的结果放上面了，方便你对比。因为高位补的是0，所以就没有显示啦，但是你心里应该清楚是怎么回事。

复合运算

广义上的复合运算指的是多个运算嵌套起来，通常这些运算都是同种类型的。这里指的复合运算指的就是和=号一起来使用，类似于+= -=。本来这属于基础常识不用做单独解释，但谁让A哥管生管养，管杀管埋呢????。

混合运算：指同一个算式里包含了bai多种运算符，如加减乘除乘方开du方等。

以&与运算为例，其它类同：

@Test
public void test() {
    int i = 0B110; // 十进制为6
    i &= 0B11; // 效果同：i = i & 3

    // 二进制结果：10
    // 十进制结果：2
    System.out.println("二进制结果：" + Integer.toBinaryString(i));
    System.out.println("十进制结果：" + (i));
}

复习一下&的运算规则是：同为1则1，否则为0。

位运算使用场景示例

位运算除了高效的特点，还有一个特点在应用场景下不容忽视：计算的可逆性。通过这个特点我们可以用来达到隐蔽数据的效果，并且还保证了效率。

在JDK的原码中。有很多初始值都是通过位运算计算的。最典型的如HashMap：

HashMap:
    
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    static final int MAXIMUM_CAPACITY = 1 << 30;

位运算有很多优良特性，能够在线性增长的数据中起到作用。且对于一些运算，位运算是最直接、最简便的方法。下面我安排一些具体示例（一般都是面试题），感受一把。

判断两个数字符号是否相同

同为正数or同为负数都表示相同，否则为不同。像这种小小case用十进制加上>/<比较符当然可以做，但用位运算符处理来得更加直接（效率最高）：

@Test
public void test4() {
    int i = 100;
    int j = -2;

    System.out.println(((i >> 31) ^ (j >> 31)) == 0);

    j = 10;
    System.out.println(((i >> 31) ^ (j >> 31)) == 0);
}

运行程序，输出：

false
true

int类型共32bit，右移31位那么就只剩下1个符号位了（因为是带符号右移动，所以正数剩0负数剩1），再对两个符号位做^异或操作结果为0就表明二者一致。

复习一下^异或操作规则：相同为0，不同为1。

判断一个数的奇偶性

在十进制数中可以通过和2取余来做，对于位运算有一个更为高效的方式：

@Test
public void test5() {
    System.out.println(isEvenNum(1)); //false
    System.out.println(isEvenNum(2)); //true
    System.out.println(isEvenNum(3)); //false
    System.out.println(isEvenNum(4)); //true
    System.out.println(isEvenNum(5)); //false
}

/**
 * 是否为偶数
 */
private static boolean isEvenNum(int n) {
    return (n & 1) == 0;
}

为何&1能判断基偶性？因为在二进制下偶数的末位肯定是0，奇数的最低位肯定是1。
而二进制的1它的前31位均为0，所以在和其它数字的前31位与运算后肯定所有位数都是0（无论是1&0还是0&0结果都是0），那么唯一区别就是看最低位和1进行与运算的结果喽：结果为1表示奇数，反则结果为0就表示偶数。

交换两个数的值（不借助第三方变量）

这是一个很古老的面试题了，交换A和B的值。本题如果没有括号里那几个字，是一道大家都会的题目，可以这么来解：

@Test
public void test6() {
    int a = 3, b = 5;
    System.out.println(a + "-------" + b);
    a = a + b;
    b = a - b;
    a = a - b;
    System.out.println(a + "-------" + b);
}

运行程序，输出（成功交换）：

3-------5
5-------3

使用这种方式最大的好处是：容易理解。最大的坏处是：a+b,可能会超出int型的最大范围，造成精度丢失导致错误，造成非常隐蔽的bug。所以若你这样运用在生产环境的话，是有比较大的安全隐患的。

小贴士：如果你们评估数字绝无可能超过最大值，这种做法尚可。当然如果你是字符串类型，请当我没说

因为这种方式既引入了第三方变量，又存在重大安全隐患。所以本文介绍一种安全的替代方式，借助位运算的可逆性来完成操作：

@Test
public void test7() {
    // 这里使用最大值演示，以证明这样方式是不会溢出的
    int a = Integer.MAX_VALUE, b = Integer.MAX_VALUE - 10;
    System.out.println(a + "-------" + b);
    a = a ^ b;
    b = a ^ b;
    a = a ^ b;
    System.out.println(a + "-------" + b);
}

运行程序，输出（成功完成交换）：

2147483647-------2147483637
2147483637-------2147483647

由于全文都没有对a/b做加法运算，因此不能出现溢出现象，所以是安全的。这种做法的核心原理依据是：位运算的可逆性，使用异或来达成目的。

位运算用在数据库字段上（重要）

这个使用case是极具实际应用意义的，因为在生产上我以用过多次，感觉不是一般的好。

业务系统中数据库设计的尴尬现象：通常我们的数据表中可能会包含各种状态属性，例如 blog表中，我们需要有字段表示其是否公开，是否有设置密码，是否被管理员*，是否被置顶等等。 也会遇到在后期运维中，策划要求增加新的功能而造成你需要增加新的字段，这样会造成后期的维护困难，字段过多，索引增大的情况，这时使用位运算就可以巧妙的解决。

举个例子：我们在网站上进行认证授权的时候，一般支持多种授权方式，比如：

个人认证 0001 -> 1
邮箱认证 0010 -> 2
微信认证 0100 -> 4
超管认证 1000 -> 8

这样我们就可以使用1111这四位来表达各自位置的认证与否。要查询通过微信认证的条件语句如下：

select * from xxx where status = status & 4;

要查询既通过了个人认证，又通过了微信认证的：

select * from xxx where status = status & 5;

当然你也可能有排序需求，形如这样：

select * from xxx order by status & 1 desc

这种case和每个人都熟悉的Linux权限控制一样，它就是使用位运算来控制的：权限分为 r 读, w 写, x 执行,其中它们的权值分别为4，2，1，你可以随意组合授权。比如 chomd 7，即7=4+2+1表明这个用户具有rwx权限，

注意事项

需要你的DB存储支持位运算，比如MySql是支持的
请确保你的字段类型不是char字符类型，而应该是数字类型
这种方式它会导致索引失效，但是一般情况下状态值是不需要索引的
具体业务具体分析，别一味地为了show而用，若用错了容易遭对有喷的

流水号生成器（订单号生成器）

生成订单流水号，当然这其实这并不是一个很难的功能，最直接的方式就是日期+主机Id+随机字符串来拼接一个流水号，甚至看到非常多的地方直接使用UUID，当然这是非常不推荐的。

UUID是字符串，太长，无序，不能承载有效的信息从而不能给定位问题提供有效帮助，因此一般属于备选方案

今天学了位运算，有个我认为比较优雅方式来实现。什么叫优雅：可以参考淘宝、京东的订单号，看似有规律，实则没规律：

不想把相关信息直接暴露出去。
通过流水号可以快速得到相关业务信息，快速定位问题（这点非常重要，这是UUID不建议使用的最重要原因）。
使用AtomicInteger可提高并发量，降低了冲突（这是不使用UUID另一重要原因，因为数字的效率比字符串高）

实现原理简介

此流水号构成：日期+Long类型的值组成的一个一长串数字，形如2020010419492195304210432。很显然前面是日期数据，后面的一长串就蕴含了不少的含义：当前秒数、商家ID（也可以是你其余的业务数据）、机器ID、一串随机码等等。

各部分介绍：

第一部分为当前时间的毫秒值。最大999，所以占10位
第二部分为：serviceType表示业务类型。比如订单号、操作流水号、消费流水号等等。最大值定为30，足够用了吧。占5位
第三部分为：shortParam，表示用户自定义的短参数。可以放置比如订单类型、操作类型等等类别参数。最大值定为30，肯定也是足够用了的。占5位
第四部分为：longParam，同上。用户一般可放置id参数，如用户id、商家id等等，最大支持9.9999亿。绝大多数足够用了，占30位
第五部分：剩余的位数交给随机数，随机生成一个数，占满剩余位数。一般至少有15位剩余（此部分位数是浮动的），所以能支持2的15次方的并发，也是足够用了的
最后，在上面的long值前面加上日期时间（年月日时分秒）

这是A哥编写的一个基于位运算实现的流水号生成工具，已用于生产环境。考虑到源码较长（一个文件，共200行左右，无任何其它依赖）就不贴了，若有需要，请到公众号后台回复流水号生成器免费获取。

✍总结

位运算在工程的角度里缺点还是蛮多的，在实际工作中，如果只是为了数字的计算，是不建议使用位运算符的，只有一些比较特殊的场景，使用位运算去做会给你柳暗花明的感觉，如：

N多状态的控制，需要兼具扩展性。比如数据库是否状态的字段设计
对效率有极致要求。比如JDK
场景非常适合。比如Jackson的Feature特针值

切忌为了炫（zhuang）技（bi）而使用，炫技一时爽，掉坑火葬场；小伙还年轻，还望你谨慎。代码在大多情况下，人能容易读懂比机器能读懂来得更重要。

码农公寓

Java二进制和位运算，这一万字准能喂饱你

✍前言

✍正文

二进制

二进制与编码

Java中的二进制

便捷的进制转换API

如何证明Long是64位的？

Java中的位运算

简单运算

&：按位与

|：按位或

~：按位非

^：按位异或

<<：按位左移

>>：按位右移

>>>：无符号右移

复合运算

位运算使用场景示例

判断两个数字符号是否相同

判断一个数的奇偶性

交换两个数的值（不借助第三方变量）

位运算用在数据库字段上（重要）

注意事项

流水号生成器（订单号生成器）

实现原理简介

✍总结

✔推荐阅读：

码农公寓

✍前言

✍正文

二进制

二进制与编码

Java中的二进制

便捷的进制转换API

如何证明Long是64位的？

Java中的位运算

简单运算

&：按位与

|：按位或

~：按位非

^：按位异或

<<：按位左移

>>：按位右移

>>>：无符号右移

复合运算

位运算使用场景示例

判断两个数字符号是否相同

判断一个数的奇偶性

交换两个数的值（不借助第三方变量）

位运算用在数据库字段上（重要）

注意事项

流水号生成器（订单号生成器）

实现原理简介

✍总结

✔推荐阅读：

相关文章