五分钟知识科普:什么是 Base64编码 | 算法必看系列三十九

原文链接

一、定义

Base64编码 是一种基于 64 个可打印字符来表示二进制数据的方法。目前 Base64 已经成为网络上常见的传输 8 位二进制字节代码的编码方式之一。
为什么会有 Base64 编码呢?因为有些网络传送渠道并不支持所有的字节,例如:传统的邮件只支持可见字符的传送,像 ASCII 码的控制字符就不能通过邮件传送。这样用途就受到了很大的限制。
图片的二进制流的每个字节不可能全部是可见字符,这就导致图片的二进制流无法传送。最好的解决方式就是在不改变传统协议的情况下,做一种扩展方案来支持二进制文件的传送。即把不可打印的字符也能用可打印字符来表示,问题就解决了。
Base64 编码就是为了实现这一方案而设计的编码格式。
Base64 就是一种基于 64 个可打印字符来表示二进制数据的表示方法
它的编码过程如下:

  • 将待转换的字符串每三个字节分为一组,每个字节占 8 个二进制位,那么共有 24 个二进制位。
  • 将第(1)步得到的每 24 个二进制位分为每 6 个一组,则每 3 个字节可分为 4 组。
  • 在每组前面添加两个 0 ,每组由 6 个二进制位变为 8 个二进制位,总共 32 个二进制位,即四个字节。
  • 根据 Base64编码对照表(见下表)获得对应的值。

五分钟知识科普:什么是 Base64编码 | 算法必看系列三十九
大多数编码都是由字符串转化成二进制的过程,而 Base64 的编码则是从二进制转换为字符串。与常规恰恰相反,Base64 编码主要用在传输、存储、表示二进制领域,不能算得上加密,只是无法直接看到明文。也可以通过打乱Base64 编码来进行加密。中文有多种编码(比如:utf-8、gb2312、gbk等),不同编码对应Base64编码结果都不一样。

二、补充

挺多人会误以为 Base64 是加密算法,喜欢在数据传输不安全的时候来一句:使用 Base64 加密一下呗。
我们先来看一下加密的定义:在密码学中,加密(英语:Encryption)是将明文信息改变为难以读取的密文内容,使之不可读的过程。只有拥有解密方法的对象,经由解密过程,才能将密文还原为正常可读的内容。
所谓加密算法就是加密的方法。
如果你使用  Base64  进行 “加密” ,第三方拿到数据可以瞬间解密,根本无法实现你想要的 加密 效果。因此,Base64 不能说是 加密算法,只能说是 编码

三、Tips

如果你需要在网络上留下你的 微信号、邮箱、QQ 、手机号等具有隐私信息的时候,你不妨留下它们对应的 Base64 编码信息。一方面,想要联系你的人需要进行解码操作,可以过滤一部分需求没那么强烈的人;另外一方面也可以形成 简单的反爬虫 操作,不容易被爬虫收集到你的隐私信息。

作者 | 程序员小吴

来源 | 五分钟学算法

上一篇:【H5疑难杂症】脱离文档流时的渲染BUG


下一篇:移动互联网时代,如何优化你的网络 —— 域名解析篇