python/java 中使用split()分割字符串时第一个字符乱码问题

这个牵扯到文件编码问题,不同格式的文件最前边有一个BOM来说明这个文件的编码格式,这个BOM是看不见的。比如我们写一个unicode格式文件,然后将其保存成utf-8格式,此时在程序中读入该文件对其进行split()分割第一个字符就会出现\ufeff乱码!
解决方法:把我们读文件时指定的utf-8改成utf-8-sig即可。sig为signature的意思,这样就会去掉文件头中的BOM。

python/java 中使用split()分割字符串时第一个字符乱码问题python/java 中使用split()分割字符串时第一个字符乱码问题 嗨!是我 发布了14 篇原创文章 · 获赞 0 · 访问量 667 私信 关注
上一篇:【语音去噪】基于matlab小波软阈值语音降噪【含Matlab源码 531期】


下一篇:Go如何监听Linux系统信号