ASCLL码
每8位bit为一个字节
由于设计之初只考虑了美国本土使用,所以只需要7位bit就足够组合出26个大写字母+小写字母,以及特殊符号(2**7 = 128)。但是还是预留了一位,所以我们看到的ASCLL码的第一位数字都是0。
但是光汉字有9万多个,8位bit不够用。为了解决这个问题这个全球化的文字问题,创建了一个“万国码”:《unicode》
unicode
最开始的unicode
用一个字节去表示所有英文字母,英文字符,数字等。(1个字节 == 8个bit)
用2个字节表示所有的中文,不够。所以就用四个字节表示(4个字节==32位bit,2**32=4294967296)。但是中文只有9万多个,很浪费空间,于是便出了一个Unicode的升级版:《utf-8》
utf-8
一个中文用3个字节表示(3字节==24位bit,2**24=16777216,包含9万个中文足够了)
GBK
国内使用,中国人自己创造的编码方式,只包含了中文和英文。使用2个字节表示
8位bit == 1个字节(byte)
1024个字节(byte)==1kb
1024kb == 1MB
1024MB == 1GB
1024GB == 1TB