urllib库
模拟浏览器发送请求的库,python自带。
-
python2:urllib urllib2
-
python3: urllib.request urllib.parse (py3整合过了,主要就是导入这两个库)
字符串 == 》二进制之间的转化
-
encode() 字符串 ==》 二进制(字节类型)
-
decode() 二进制 (字节类型)==》 字符串
-
如果括号里面不写参数,默认utf8。写就写gbk。一般就用两种
urllib.request(介绍这个库里面的两个方法)
-
urlopen(url)
-
urlretrieve(url,image_path) #见代码8
-
urllib.parse
response
-
read() #读取响应内容,内容是字节类型(二进制)代码1
-
geturl() #根据响应的内容获取请求的url 代码2
-
getheaders() #获取头部信息,返回值是列表里面有元组 代码3
-
getcode() #获取状态码 代码4
-
readlines() #按行读取,返回的都是字节类型。一般不用 代码5,代码6, 代码7.(图片只能写入本地二进制格式)
代