一、关于urllib
中常用方法的介绍
-
1、
urlopen
网络请求urlopen
方法是网络请求的方法,默认是get
请求,如果传递了data
是post
请求from urllib import request if __name__ == "__main__": response = request.urlopen('http://www.baidu.com') print(response.read())
-
2、
urlretrieve
下载文件from urllib import request if __name__ == "__main__": # 下载整个网页 request.urlretrieve('http://www.baidu.com', 'baidu.html') # 下载图片 request.urlretrieve('http://www.baidu.com/img/bd_logo1.png', 'baidu.png')
二、关于编码的处理
-
1、
urlencode
将字典类型数据转换为parsed
模式from urllib import parse if __name__ == "__main__": dict1 = { "name": "hello", "age": "20", "gender": "man" } re = parse.urlencode(dict1) print(re) # name=hello&age=20&gender=man
-
2、
parse_qs
和parse_qsl
反序列化from urllib import parse if __name__ == "__main__": dict1 = { "name": "hello", "age": "20", "gender": "man" } re = parse.urlencode(dict1) print(re) print(parse.parse_qs(re))
三、切割url
的方法
-
1、
urlsplit
和urlparse
方法from urllib import request, parse if __name__ == "__main__": url = 'http://www.baidu.com?name=hello&age=20' print(parse.urlsplit(url)) print(parse.urlparse(url)) # 输出 # SplitResult(scheme='http', netloc='www.baidu.com', path='', query='name=hello&age=20', fragment='') # ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='name=hello&age=20', fragment='')