1. ANSI:获取当前操作系统的编码(在cmd中输入chcp,或者【cmd --> 属性 --> 选项】查看)
2. ASCII:英文字符(一个字节的 7 位)
3. GB2312:简体中文(其中包含了ASCII,最多两个字节表示)
- 一个字节:和ASCII一致,其中 字节的第一位是 0
- 两个字节:表示简体中文
4. GBK:简体中文 + 繁体(GB2312的升级,加入了繁体字,最多两个字节)
5. Unicode、UTF-8、UTF-16、UTF-32 :包含各国的字符
-
Unicode:每个字符表示都是等长
【如果 Unicode 是用四个字节对各国的字符进行编码,那么 Unicode 表示一个英文字符,需要四个字节。而 ASCII 或者 GB2312 只需要一个字节。 --> Unicode 浪费空间】 -
UTF-8:可变长的编码方案,可以用1、2、3或者4个字节表示不同字符(一个字节:和ASCII一致)
【UTF-8表示英文也只需要一个字节。】