Ascii码 unicode码 utf-8编码 gbk编码的区别

ASCII码: 只包含英文,数字,特殊符号的编码,一个字符用8位(bit)1字节(byte)表示

Unicode码: 又称万国码,包含全世界所有的文字,符号,一个字符用32位(bit)4字节(byte)

utf-8编码: 最短用8位(bit)1字节(byte)表示,用8位(bit)表示 英文字符,用16位(bit)2字

节(byte)表示 欧洲语言字符,用24位(bit)3字节(byte)表示亚洲文字

gbk编码: 国标 只包含英文字符和自己国家的字符,用8位(bit)1字节(byte)表示英文字符

用16位(bit)2字节(byte)表示中文字符

为了节省内存或减少网络加载的带宽会采取最优的编码方式

例如:字符 “chen陈”,Unicode码 要占用20个字节(byte) ,utf-8编码 占用7字节(byte),gbk 编码占用6字节(byte)

上一篇:Hadoop namenode无法启动


下一篇:Nginx 日志分享