【情感分析必备】python文件读写:codecs

上午在读取文件时,发生错误:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte
【情感分析必备】python文件读写:codecs

 

 


切换编码:gbk,正常解决。
【情感分析必备】python文件读写:codecs

但有时,
utf-8和gbk都不好使用,使用notepad++,打开有乱码;看到有小块黑色。

【情感分析必备】python文件读写:codecs
chardet查看,因为乱码原因,被误认为别的格式。

【情感分析必备】python文件读写:codecs

 

 

这时候,需要加个参数, errors="ignore"

 【情感分析必备】python文件读写:codecs

 

 参考网站:https://www.cnblogs.com/always-fight/p/10304806.html

 


上一篇:Python学习笔记:字符编码原理和操作详解


下一篇:使用Java中的kerberos票证获取AD组