Python:如何读取和解析unicode utf-8文本文件?

我从Excel导出UTF-8文本,我想使用Python读取和解析传入的数据.我已经阅读了所有在线信息,所以我已经尝试过这个,例如:

 txtFile = codecs.open( 'halout.txt', 'r', 'utf-8' )
 for line in txtFile:
  print repr( line )

我得到的错误是:

UnicodeDecodeError:’utf8’编解码器无法解码位置0的字节0xff:意外的代码字节

在Hex编辑器中查看文本文件,第一个值是FFFE我也尝试过:

txtFile.seek( 2 )

在“打开”之后,这只会导致不同的错误.

解决方法:

那是一个BOM

从编辑中编辑,它似乎是一个极好的16爆炸

codecs.open('foo.txt', 'r', 'utf-16')

应该管用.

上一篇:如何在android中以编程方式执行命令行ffmpeg命令?


下一篇:为什么采用C/S体系结构