oracle数据库字符集导致数据乱码的问题

前言:

  将表导入数据库后,发现很多的乱码,而原数据在原库中是没有问题的,找了很多资料来看,发现可能是字符集的问题,检查处理后,问题得到了解决,撰文记之:

  oracle数据库常用的字符编码格式为ZHS16GBK,下面就是更换字符集实操的记录:

[oracle@woitumi-197 dbs]$ sqlplus / as sysdba

启动数据库:
SQL> startup SQL>shutdown immediate; SQL>STARTUP MOUNT; SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION; SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0; SQL>ALTER SYSTEM SET AQ_TM_PROCESSES=0; SQL>ALTER DATABASE OPEN; SQL>ALTER DATABASE CHARACTER SET ZHS16GBK;

接下来可能出现两种情况:

ERROR at line 1  RA-12721: operation cannot execute when other sessions are active
1、若出现上面的错误,使用下面的办法进行修改,使用INTERNAL_USE可以跳过超集的检查:

SQL>ALTER DATABASE CHARACTER SET INTERNAL_USE ZHS16GBK;

2、结果报错,提示新字符集必须是老字符集的超集。

ORA-12712: new character set must be a superset of old character set
RROR at line 1:

需要强制转换:

>ALTER DATABASE character set INTERNAL_USE ZHS16GBK;

以上两种情况是我所遇到的问题,在执行了相关命令后,执行最后步骤:

>shutdown immediate;
>STARTUP;

附:

  在数据库备份文件导入时,

1. oracel server端的字符集;

2. oracle 远程连接工具的字符集;

3. 导出dmp文件数据库的的字符集。

 这三者必须相同,操作后的数据,才不会出现乱码

查询方法:

查询oracle server端的字符集

有很多种方法可以查出oracle server端的字符集,比较直观的查询方法是以下这种:

SQL> select userenv('language') from dual;

USERENV('LANGUAGE')

----------------------------------------------------

SIMPLIFIED CHINESE_CHINA.ZHS16GBK

 

SQL>select userenv(‘language’) from dual;

AMERICAN _ AMERICA. ZHS16GBK

如何查询dmp文件的字符集

用oracle的exp工具导出的dmp文件也包含了字符集信息,dmp文件的第2和第3个字节记录了dmp文件的字符集。如果dmp文件不大,比如只有几M或几十M,可以用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下sql查出它对应的字符集:

SQL> select nls_charset_name(to_number('0354','xxxx')) from dual;

ZHS16GBK

如果dmp文件很大,比如有2G以上(这也是最常见的情况),用文本编辑器打开很慢或者完全打不开,可以用以下命令(在linux主机上):

cat exp.dmp |od -x|head -1|awk '{print $2 $3}'|cut -c 3-6

上一篇:expdp和impdp用法详解


下一篇:oracle的数据泵命令的方式导入与导出