字符编码

一、ASCII字符集(American Standard Code for Information Interchage)

  128个字符(96个可打印字符+32个控制字符)2^7——7位二进制数表示一个字符

  一个字节存放一个ASCII字符

二、MBCS多字节字符集(Multi-Bytes Charcter Set),又称“ANSI编码”

  中文系统:ANSI编码代表GB 2312

    GB 2312-1980:6763个常用汉字和682个的非全角汉字字符

    GBK-1995(Chinese Internal Code Specification):21003个汉字+图形符号 883 个图形符号

    GB 18030-2000:27533个汉字

    GB 18030-2005:70244个汉字

  *、香港及澳门:Big5(大五码)——繁体汉字13053个+808个标点符号、希腊字母及特殊符号

  日文系统:ANSI编码代表JIS

  韩文系统:ANSI编码代表KS

三、UNICODE,UCS(Universal Multiple-Octet Coded Character Set)——ISO国际标准化组织,包括了地球上所有文化、所有字母和符号的编码

  一个字符就是两个字节     2^16=65536

  UTF(UCS Transfer Format)

三、解决乱码中心思想——什么方式编码就用什么方式解码

上一篇:hadoop官网介绍及如何下载hadoop(2.4)各个版本与查看hadoop API介绍


下一篇:MySQL 中的单引号、双引号、反引号