以下案例只对登录不需要验证码登录的网页才有效
1 """""" 2 3 4 # 大鹏主页:dapeng_url = "http://www.renren.com/880151247/profile" 5 # 人人网登录login_url = ‘http://www.renren.com/PLogin.do‘ 6 # 人网登录新页面http://www.renren.com/ysSHome.do 7 8 from urllib import request 9 from urllib import parse 10 from http.cookiejar import CookieJar 11 12 # 1登录 13 # 1.1创建一个cookie对象 14 cookiejar = CookieJar() 15 # 1.2使用cookiejar创建一个httpcookieprocess对象 16 handler = request.HTTPCookieProcessor(cookiejar) 17 # 1.3使用上一步创建的handle创建一个opener 18 opener = request.build_opener(handler) 19 # 1.4使用opener发送登录的请求(帐号+密码) 20 headers = { 21 "User-Agent": "Mozilla/5.0" 22 } 23 data = { 24 ‘email‘:‘邮箱地址‘, 25 ‘password‘:‘密码‘ 26 } 27 login_url = ‘http://www.renren.com/PLogin.do‘ 28 #login_url = ‘http://www.renren.com/SysHome.do‘ #新的网站登录页面用要用method= ‘GET‘请求 29 req = request.Request(login_url, 30 headers=headers, 31 data=parse.urlencode(data).encode(‘utf-8‘)) 32 opener.open(req) 33 34 35 # 2 访问个人主页 36 dapeng_url = "http://www.renren.com/880151247/profile" 37 # 获取个人主页的信息时候,应该使用先前opener,含有cookie信息 38 req2 = request.Request(dapeng_url, 39 headers=headers) 40 resp2 = opener.open(req2) 41 with open(‘renren2.html‘, ‘w‘, encoding=‘utf-8‘) as fp: 42 fp.write(resp2.read().decode(‘utf-8‘))
结果
可以访问
http://www.renren.com/880151247/profile
file:///C:/Users/udbfu/Desktop/%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB/renren2.html