今天我在爬取一个网页时出现了下面这个错误:
UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence
从这个错误来看应该是编码时出错了,于是我在网上查了些资料,找到了解决方法:
source_code.encode('GB18030')
解释:GB18030是GBK的父集,所以能兼容GBK不能编码的字符。
2022-09-19 08:30:18
今天我在爬取一个网页时出现了下面这个错误:
UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence
从这个错误来看应该是编码时出错了,于是我在网上查了些资料,找到了解决方法:
source_code.encode('GB18030')
解释:GB18030是GBK的父集,所以能兼容GBK不能编码的字符。