urllib库>>>>urllib.request(介绍这个库里面的两个方法)

urllib库
模拟浏览器发送请求的库,python自带。

  • python2:urllib urllib2

  • python3: urllib.request urllib.parse (py3整合过了,主要就是导入这两个库)

    字符串 == 》二进制之间的转化

  • encode() 字符串 ==》 二进制(字节类型)

  • decode() 二进制 (字节类型)==》 字符串

  • 如果括号里面不写参数,默认utf8。写就写gbk。一般就用两种

    urllib.request(介绍这个库里面的两个方法)

  • urlopen(url)

  • urlretrieve(url,image_path) #见代码8

  • urllib.parse

    response

  • read() #读取响应内容,内容是字节类型(二进制)代码1

  • geturl() #根据响应的内容获取请求的url 代码2

  • getheaders() #获取头部信息,返回值是列表里面有元组 代码3

  • getcode() #获取状态码 代码4

  • readlines() #按行读取,返回的都是字节类型。一般不用 代码5,代码6, 代码7.(图片只能写入本地二进制格式)

上一篇:python 爬虫 urllib请求对象的定制


下一篇:python模拟浏览器请求