python2升级到python3时遇到的编码问题汇总

本文档总结了python2->3升级过程中遇到的编码问题

1.UnicodeDecodeError:“ascii” codec cannot decode byte oxe6 in position 501:ordinal not in range

定位:从报错日志可以发现代码运行到with open(a.txt, "r")as f:时报错,即读取文件时出错。

分析:with open 方法参数encoding没有写则默认为ascii,查看磁盘上的文件编码格式为utf8。故导致指定的ascii不能打开utf8编码的文件,ascii不能完全匹配utf8的字符集。

解决:with open(a.txt, "r")as f:改为with open(a.txt, "r", encoding="uft8")as f:

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

2.UnicodeDecodeError:“utf8” codec cannot decode byte oxa3 in position 25:invalid start byte

定位:报错日志指向with open(b.txt, "r", encoding="uft8")as f:

分析:磁盘上b.txt是utf8的编码格式,encodeing也指定了,但oxa3(utf8编码)是一个无效的字节,在文本模式(“r”)读取时无法解码为unicode编码格式。

解决:

  方法1.删除b.txt里面的中文。

  方法2.r->rb,以二进制形式读取,byte->byte,不会出现byte->str的解码报错信息。

 

上一篇:多版本python使用pip的正确做法


下一篇:Linux手动安装新版本Python教程(CentOS)