ASCII码表:
计算机里只有数字,我在计算机软件里的一切都是用数字来表示,屏幕上显示的一个个字符也不例外。计算机诞生在美国,最开始所用到字符就是我们现在键盘上的一些符号和少数几个特殊的符号,每一个字符都用一个数字来表示,一个字节所能表示的数字范围足以容纳这些字符,表示这些字符的数字的字节最高位(bit)都为0,说明这些数字都在0~127之间,如字符a对应数字97,字符b对应数字98等,这种字符与数字对应的编码固定下来后,这套编码规则被称为ASCII(美国标准信息交换码)。
GBK码表:
随着计算机逐渐在其他国家的应用和普及,许多国家都把本地的字符集引入到了计算机里面,比如中国,用一个字节所能表示的数字范围根本不能容纳所有的中文汉字,于是中国将每一个中文字符都用两个字节的数字来表示,原有的ASCII字符的编码保持不变,仍用一个字节表示,为了将一个中文字符与两个ASCII码字符区别开来,中文字符的每个字节的最高位(bit)都为1,中国为每一个中文字符都指定了一个对应的数字,并作为标准的编码固定下来,这套编码规则称为GBK(国际码)。
GB2313码表(GBK码表的扩充版):
后来的后来又在GBK的基础上对更多的中文字符(包括繁体)进行了编码,新的编码系统就是GB2312,可见GBK是GB2312的子集。
BIG5码表:
使用中文的国家有很多,同样的一个字符,如“中国”的“中”字,在中国的编码是十六进制的D6D0,而在*的编码是十六进制的A4A4,*对中文字符集的编码规则称为BIG5(大五码)。
Unicode码表:
为了解决各个国家和地区使用本地化字符编码带来的不利影响,人们将全世界所有的符号进行了统一编码,称为Unicode编码,所有字符不再区分国家和地区,都是人类有的符号,如"中国"的"中"这个符号,在全世界的任何角落始终对应的都是一个十六进制的数字4e2d,如果所有的计算机系统都使用这种编码方式。在中国的本地化系统显示的“中”,发送到伊拉克的本地化系统中,显示的仍然是"中"这个符号Unicode编码的字符都占用两个字节的大小,也就是说全世界所有的字符个数不会超过2的16次方。