我经历了很多,我将在Eclipse(PyDev)中解码/编码一些Unicode字符串,它运行良好,我的预期,但是当我从命令行启动相同的脚本时(例如)相反,我会得到编码错误.
这有什么简单的解释吗? Eclipse是否对Unicode做了些什么/以某种不同的方式操作它?
编辑:
例:
value = u'\u2019'.decode( 'utf-8', 'ignore' )
return value
这适用于Eclipse(PyDev),但如果我在空闲或命令行中运行它,则不行.
UnicodeEncodeError: ‘ascii’ codec can’t encode character u’\u2019′ in position 135: ordinal not in range(128)
解决方法:
value = u'\u2019'.decode( 'utf-8', 'ignore' )
字节字符串被解码为Unicode字符串.
Unicode字符串被ENCODED成字节字符串.
因此,如果您说someunicodestring.decode,它会尝试将Unicode字符串强制转换为字节字符串,以便能够对其进行解码(返回Unicode!).作为一个隐式转换,这个编码步骤将丰富默认编码,这可能在不同的环境之间有所不同,并且可能是’安全’值ascii,这肯定会产生你提到的错误,因为ASCII不能包含字符U 2019.依赖默认编码几乎绝不是一个好主意.
因此尝试解码Unicode字符串没有意义.我很确定你的意思是:
value = u'\u2019'.encode('utf-8')
(忽略对于编码为UTF-8是多余的,因为没有此编码无法表示的字符.)