字符编码
字符编码(Character Code)就是规定用怎样的二进制码来表示字母、数字以及一些专用符号。
在计算机系统中,有两个重要的字符编码方式,一种是美国国际商业机器公司(IBM)的扩充二进制码 EBCDIC,主要用于 IBM 的大型主机,还有一种就是微型计算机系统中用得最多最普遍的美国标准信息交换码(American Standard Code for Information Interchange, ASCII)。该编码已经被国际标准化组织(ISO)接收为国际标准,所以又称为国际 5 号码。因此,ASCII 是目前国际上比较通用的信息交换码。
ASCII 编码
ASCII 有 7 位 ASCII 和 8 位 ASCII 两种,7 位 ASCII 可以表示 128 个 字符,它包含 10 个阿拉伯数字、52 个英文大小写字母、32 个字符和运算符以及 34 个控制码。
比如,字母 a 的二进制码为 01100001,十六进制码为 61,十进制码为 97。
由于 128 个字符不够,就把原来的 7 位码扩充为 8 位码,就可以表示 256 个字符。
BCD 编码
BCD 编码(Binary-Coded Decimal),用四位二进制数来表示一位十进制数中的0~9这十个数字。BCD 编码使二进制和十进制之间的转换得以快捷的进行。这种编码技巧最常用于会计系统的设计里,因为会计制度经常需要对很长的数字串作准确的计算。相对于一般的浮点式记数法,采用 BCD 编码,既可保存数值的精确度,又可免去使计算机作浮点运算时所耗费的时间。此外,对于其他需要高精确度的计算,BCD 编码亦很常用。
Unicode 编码
Unicode 是一种 16 位的编码,能够表示 65000 多个字符或符号。目前,世界上的各种语言一般使用的字母或符号都在 3400 个左右,所以 Unicode 编码可以用于任何一种语言。Unicode 编码与现在流行的 ASCII 完全兼容,二者的前 256 个符号都是一样的。