在进行web开发和oracle安装的过程中经常有人对字符集搞不清楚,因此对此做一下总结。
1.第一个问题:字符集之间的区别是什么呢?
常见的字符集有:UTF-8和GBK
(1)GBK字符集
- GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
- GBK包含全部中文字符;
- GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
- GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~
(2)UTF-8字符集
- UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。
- UTF-8则包含全世界所有国家需要用到的字符。
- UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。
- UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛
一般来说,国内的系统如果要保存汉字,一般会选择使用GBK字符集,如果是想做网站等,全球可访问的系统,那么一般选择UTF-8。
2.数据库中哪些字符集需要设置?
数据库分客户端字符集和数据库服务器字符集。
而oracle的服务器字符集又有两种:常规字符集(一般意义上的数据库字符集)和国家字符集
1. 常规意义上的字符集(一般意义上的数据库字符集):
(1)用来存储CHAR, VARCHAR2, CLOB, LONG等类型数据
(2)用来标示诸如表名、列名以及PL/SQL变量等
(3)用来存储SQL和PL/SQL程序单元等
(4)一般为:AL32UTF8 或者 ZHS16GBK
2. 国家字符集:
(1)用以存储NCHAR, NVARCHAR2, NCLOB等类型数据
(2)国家字符集实质上是为oracle选择的附加字符集,主要作用是为了增强oracle的字符处理能力,因为NCHAR数据类型可以提供对亚洲使用定长多字节编码的支持,而数据库字符集则不能。国家字符集在oracle9i中进行了重新定义,只能在unicode编码中的AF16UTF16和UTF8中选择,默认值是AF16UTF16
3.字符集查看方法
数据库字符集:select * from nls_database_parameters;
客户端字符集:select * from nls_instance_parameters;
数据库字符集的表示方式为:
SIMPLIFIED CHINESE_CHINA.AL32UTF8
SIMPLIFIED CHINESE_CHINA.ZHS16GBK
如果客户端字符集和数据库字符集不一致时,通过plSql登陆时会提示如下错误:
4.客户端字符集设置方法
32位客户端: HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\
64位客户端:HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\ORACLE\KEY_OraClient11g_home1
5.建议的字符集是什么?
数据库字符集:SIMPLIFIED CHINESE_CHINA.ZHS16GBK(国内大部分数据库还是oracle多,如果做网站的话还是建议使用UTF-8字符集)
国家字符集:SIMPLIFIED CHINESE_CHINA.AL16UTF16
客户端字符集:SIMPLIFIED CHINESE_CHINA.ZHS16GBK
网页字符集:UTF-8
经过实验,不会出现乱码。
参考文章:
出处:http://www.cnblogs.com/sdjnzqr/
版权:本文版权归作者和博客园共有
转载:欢迎转载,但未经作者同意,必须保留此段声明;必须在文章中给出原文连接;否则必究法律责任