linux下的中文编码问题

很多linux的初学者都会碰到这样一个问题:把windows下的文档拷到linux系统,会出现乱码!其实这涉及到中文编码的问题。linux系统默认的是统一码(utf8)。而如果你的文件是big5,显然会出现乱码!针对此问题,你可以采用下述两种方法:

一、在知道乱码文档编码格式的前提下,更改系统支持的语系:
假设乱码文档编码格式为gb2312(简体中文),则可使用命令:LANG=gb2312。也可以通过终端界面的菜单栏 -> 工具栏 -> 终端机 -> 设置字符编码进行设置。但此方法会出现问题,就是系统下的其他中文成了乱码。所以,如果此文档若在linux下常用,不建议采用此方法。
二、语系编码转换:
强大的linux绝对不会让你在这个小问题上束手无策的。系统提供了一个转换文档编码格式的工具:
命令格式为:iconv  -f 原来编码格式  -t  新编码格式  文件名  [-o 新文件名] 其中新文件名为可选项
例如windows下的thinker.txt的简体中文编码为gb2312,则可以这样转换:
iconv -f gb2312 -t utf8 thinker.txt -o thinker.utf8
    以上探讨的内容都是针对文档内容乱码问题,无法解决文件名及目录乱码问题。文件名及目录乱码可以用工具convmv;具体用法类似iconv,但要注意加上--notest选项才是真正的转换,否则只是个测试效果而已!

linux下的中文编码问题

上一篇:Redis双机热备方案--转


下一篇:J2EE架构