出现这个问题, 我首先去找了一下几个问题:
1.文件是否是utf-8
2.上传到Linux中的hadoop, 在Linux下去查看是否乱码
3.上面都没有问题, 就去检查eclipse,将项目工程改成了utf-8, 发现不行
4.看了一下的介绍, 将eclipse的系统设置改成了uft-8, 就可以了
eclipse中UTF-8设置
1.windows->Preferences 打开"首选项"对话框;
2.然后,general->Workspace,右侧Text file encoding,选择Other,改变为UTF-8。
3.Web->打开,把CSS、HTML、JSP、JavaScript、 XML等设置为UTF-8。
或在这里更改,general->Content Types,右侧Context Types树,点开Text,选择Java Source File,在下面的Default encoding输入框中输入UTF-8,点Update,则设置Java文件编码为UTF-8。其他如果需要更改,方法一样。
4.java->Installed JREs.
移除原来Eclipse自带的Jdk6.0,从新配置Jdk 1.6.0_06(Add:在C盘,Programe里的Java文件下。C:\Program Files\Java)
另外,
myeclipse中UTF-8设置
同样,
1Window 选项下---preferences选项;
2打开preferences->General->workspace,设置UTF-8;
3同样是preferences->MyEclipse->Files and Editors ->CSS、HTML、JSP、JavaScript、XML等设置UTF-8。
4同样是preferences->java->Installed JREs:移除原来的MyEclipse自带的Jdk6.0,从新配置Jdk1.6.0_06(Add:在C盘,Programe里的Java文件下)。
修改原因:
如果要使插件开发应用能有更好的国际化支持,能够最大程度的支持中 文输出,则最好使 Java文件使用 UTF-8编码。然而,Eclipse工作空 间(workspace)的缺省字符编码是操作系统缺省的编码,简体中文操作系统 (Windows XP、Windows
2000简体中文)的缺省编码是GB18030,在此工作空间中建立的工程编码是GB18030,工程中建立的java文件也是GB18030。如果要使 新建立工程、java文件直接使UTF-8则需要做上面的工作,不容忽略。