写这篇文章的是一位外国人,他遇到了什么问题呢?比如有一个 Unicode 字符串他需要转为 ascii码:
>>> title = u"Klüft skräms inför på fédéral électoral große"
>>> print title.encode(‘ascii’,'ignore’)
Klft skrms infr p fdral lectoral groe
可以看到丢了许多的字符。那么他在探求有没有一个好的方法,可以把类 Ascii 码的字符转为相应的 ascii 码呢?我的确在邮件列表中好象注意到有这么一封邮件。结果他找到方法了:
>>> import unicodedata >>> unicodedata.normalize('NFKD', title).encode('ascii','ignore') 'Kluft skrams infor pa federal electoral groe'
可以看到输出结果非常好。