python+selenium调用chrome打开网址获取内容

通过selenium库,python可以调用chrome打开指定网页并获取网页内容或者模拟登陆获取网页内容

1,安装selenium和配置chromedriver

  • 安装selenium
C:\Users\cord> pip install selenium
  • 配置chromedriver

下载路径: http://chromedriver.storage.googleapis.com/index.html

该下载什么版本根据浏览器版本以及附录的版本对照表下载

将下载的压缩包解压后得到的chromedriver.exe复制到C:\Program Files (x86)\Google\Chrome\Application路径下即可

2,调用chromedriver打开网页获取网页内容

from selenium import webdriver

#设置chromedriver
browser = webdriver.Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe")
#设置超时时间
browser.set_page_load_timeout(10)
#打开网页
browser.get("http://www.cnblogs.com/cord/")
#打印网页内容
print(browser.page_source) print("--------------------------------------------------------------------------------") browser.get("https://www.baidu.com")
print(browser.page_source)

3,模拟登陆百度云

from time import sleep
from selenium import webdriver browser = webdriver.Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe")
sleep(0.5)
browser.get("https://pan.baidu.com/")
sleep(2) #等待页面加载
browser.find_element_by_xpath('//*[@id="TANGRAM__PSP_4__footerULoginBtn"]').click() #选择账号密码登录
sleep(2)
browser.find_element_by_name("userName").send_keys("1142903706@qq.com") #输入账户密码
browser.find_element_by_name("password").send_keys("1142903706")
browser.find_element_by_xpath('//*[@id="TANGRAM__PSP_4__submit"]').click() #登录 sleep(1)
#退出
browser.close()
browser.quit()

附录(webdriver版本兼容列表)

chromedriver版本 支持的Chrome版本
v2.46 v71-73
v2.45 v70-72
v2.44 v69-71
v2.43 v69-71
v2.42 v68-70
v2.41 v67-69
v2.40 v66-68
v2.39 v66-68
v2.38 v65-67
v2.37 v64-66
v2.36 v63-65
v2.35 v62-64
v2.34 v61-63
v2.33 v60-62
v2.32 v59-61
v2.31 v58-60
v2.30 v58-60
v2.29 v56-58
v2.28 v55-57
v2.27 v54-56
v2.26 v53-55
v2.25 v53-55
v2.24 v52-54
v2.23 v51-53
v2.22 v49-52
v2.21 v46-50
v2.20 v43-48
v2.19 v43-47
v2.18 v43-46
v2.17 v42-43
v2.13 v42-45
v2.15 v40-43
v2.14 v39-42
v2.13 v38-41
v2.12 v36-40
v2.11 v36-40
v2.10 v33-36
v2.9 v31-34
v2.8 v30-33
v2.7 v30-33
v2.6 v29-32
v2.5 v29-32
v2.4 v29-32

版本选择相关网站: https://sites.google.com/a/chromium.org/chromedriver/downloads/version-selection

参考链接:

https://www.jianshu.com/p/4b84a7d7e567

https://www.cnblogs.com/eternal1025/p/8880245.html

https://blog.csdn.net/qq_29186489/article/details/78661008

https://www.cnblogs.com/JHblogs/p/7699951.html

上一篇:seajs原理解析


下一篇:Servlet.service() for servlet jsp threw exception