关于java.util.Properties读取中文乱码的正确解决方案(不要再用native2ascii.exe了)

从Spring框架流行后,几乎根本不用自己写解析配置文件的代码了,
但近日一个基础项目(实在是太基础,不能用硕大繁琐的Spring),

碰到了用java.util.Properties读取中文内容(UTF-8格式)的配置文件,发生中文乱码的现象,

  1. Properties prop=new Properties();
  2. prop.load(Client.class.getClassLoader().getResourceAsStream("config.properties"));

习惯性google了一下,网上大多数文章都是让大家用native2ascii.exe转换 这样的解决方案,一开始还差点被懵住了,以为只能使用这样的绕弯子方法。。。

但关键是,太绕了! 如果每次都用native2ascii.exe将中文转换成\uXXXX\uXXXX这样的,麻烦先不说,转换完后的文件完全不可读!!!这基本上是不可忍受的!
(虽然也能用native2ascii.exe转换回来,但同样,麻烦!)

冷静下来后,突然想起来,还是初学java时看过,java.io包中 Reader/Writer和Stream的区别。
(年代久远,具体细节忘记了,大概是:Reader/Write是处理编码文本的,而InputStream/OutputStream只把数据当作2进制流 )

正确解决方案

  1. Properties prop=new Properties();
  2. prop.load(new InputStreamReader(Client.class.getClassLoader().getResourceAsStream("config.properties"), "UTF-8"));

其中“UTF-8”,用于明确指定.properties文件的编码格式(不指定则默认使用OS的,这会造成同一份配置文件同一份代码,在linux和windows上、英文windows和中文windows之间的表现都不一致),这个参数应该和具体读取的properties文件的格式匹配。

这个东西实在是基础,本来没啥好说的;但是网上流传的关于那个绕弯方法的文章太多了,太误导人了,还是写一下以正视听吧。

-------------------------------------------------------

后续:这两天发现,使用这种方法要注意一下,在linux下开发的.properties,如果要用到windows上,需要先用unix2dos 转换一下,否则可能发生配置项丢失的现象(可能是linux下的\r到了windows下不被Reader识别)。

上一篇:Python中and(逻辑与)计算法则


下一篇:如何使Python完美升级到新版本