f = urllib2.urlopen(url,timeout=10)
data = f.read()
# decode the html
contentType = f.headers.get('Content-Type')
if contentType.find("gbk"):
data = unicode(data, "GBK").encode("utf-8")
elif contentType.find("utf-8"):
pass
相关文章
- 08-16python之路--while, 格式化输出, 编码
- 08-16GO 获取网页信息时自动转换编码格式
- 08-16【Python】对url进行编解码 ,编码格式类似“%xxxx”
- 08-16Python time模块,获取当前时间,获取当前日期,日期格式化时间格式化代码实现
- 08-16Python获取日期和时间格式及去除前置零
- 08-16python学习心得--编码格式篇
- 08-16如何设置python的编码格式为utf-8
- 08-16python_format格式化输出、while else、逻辑运算符、编码初识
- 08-16python之while循环/格式化输出/运算符/初始编码/成员变量
- 08-1604 Python之while循环/格式化输出/运算符/编码