在将字符串写入文件时,执行f.write(str),后台总是报错:UnicodeEncodeError: 'ascii' codec can't encode character u'\u8888' in position 0: ordinal not in range(168),即ascii码无法被转换成unicode码。在仔细推敲后发现,我所使用的python2.7,默认编码是ascii格式。可以使用如下语句查看python默认编码格式:
import sys print(sys.getdefaultencoding())
当目标文件为utf-8,或你要读取的文件为utf-8时,系统就常识以ascii格式处理,所以就错了。
解决的办法就是:
方式一:在python代码中进行改变,
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
注意:使用此方式,有极大的可能导致print函数无法打印数据!
方式二:python安装目录下的lib\site-packages文件夹下新建一个sitecustomize.py,文件中的代码为:
import sys
sys.setdefaultencoding('utf-8')
这是比较推荐的方式。
这样在python文件中就不用在import 模块后添加
reload(sys)
sys.setdefaultencoding('utf8')
这两句话了,也不用担心print失效的问题