编码方式

ASCLL码

每8位bit为一个字节

由于设计之初只考虑了美国本土使用,所以只需要7位bit就足够组合出26个大写字母+小写字母,以及特殊符号(2**7 = 128)。但是还是预留了一位,所以我们看到的ASCLL码的第一位数字都是0。

但是光汉字有9万多个,8位bit不够用。为了解决这个问题这个全球化的文字问题,创建了一个“万国码”:《unicode》

unicode

最开始的unicode

  用一个字节去表示所有英文字母,英文字符,数字等。(1个字节 == 8个bit)

  用2个字节表示所有的中文,不够。所以就用四个字节表示(4个字节==32位bit,2**32=4294967296)。但是中文只有9万多个,很浪费空间,于是便出了一个Unicode的升级版:《utf-8》

utf-8

  一个中文用3个字节表示(3字节==24位bit,2**24=16777216,包含9万个中文足够了)

GBK

  国内使用,中国人自己创造的编码方式,只包含了中文和英文。使用2个字节表示

 

8位bit == 1个字节(byte)

1024个字节(byte)==1kb

1024kb == 1MB

1024MB == 1GB

1024GB == 1TB

 

编码方式

上一篇:FreeRTOS-04-内核控制函数+时间管理函数


下一篇:Optimization for Training Deep Models(3)