解决“UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence”错误

今天我在爬取一个网页时出现了下面这个错误:

UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence

从这个错误来看应该是编码时出错了,于是我在网上查了些资料,找到了解决方法:

source_code.encode('GB18030')

解释:GB18030是GBK的父集,所以能兼容GBK不能编码的字符。

链接:https://www.cnblogs.com/yestreenstars/p/5524631.html

上一篇:c语言向文件中写入


下一篇:Windows Server 2008 R2 创建辅助DNS服务器并接管主要DNS服务器