Python+Selenium+Chrome 的一个案例

2022-09-27 08:29:20

第一步，下载chromeDrive:http://npm.taobao.org/mirrors/chromedriver(我下载的是2.43版本的chromedriver_win32.zip)

下载之后，把chromedriver.exe 解压到安装JetBrains PyCharm 2018.2.4 x64的路径下。

第二步，在JetBrains PyCharm 2018.2.4 x64 工具中下载selenium库，具体如何下载，请看我的博客"JetBrains PyCharm 2018.2.4 x64 工具里如何安装bs4"。

第三步：自动打开chrome浏览器

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

dest = r"F:\python\chromedriver.exe"  #chromedriver本地保存的路径

'''
 实例化webdriver时，可以通过参数对浏览器做些设置，如设置网络代理、浏览器下载文件保存路径等。若是不传参数，则默认继承本地浏览器设置,
 若是对浏览器启动时属性进行设置，则就利用到了ChromeOption类。具体信息可参考chromedriver官网。“Python+Selenium+第三方浏览器”可以处理多种爬虫场景，
 包括静态页面，post表单，以及JS等。应用场景很强大，使用selenium操作浏览器进行模拟点击的方式就可以让我们省心很多，不需要担心有什么“隐藏字段”、cookie追踪等。
 但对于包含验证码网页的操作，这种方式也不好处理，主要困难在于图像识别。若是页面包含验证码，那就需要结合图像识别工具了，
 这种情况相对也比较难处理，图像识别准确率受到图片内容影响。
'''

def init_webdriver(proxy=False):
      ''' 设置浏览器默认下载路径 '''
      PROXY ="x.x.x.x;8080" 
      options =webdriver.ChromeOptions() 
      options.add_experimental_option("prefs", { "download.default.directory": r"F:\python\download", "safebrowsing.enabled":True }) 
      if proxy: 
          options.add_argument('--proxy-seerver=%s'% PROXY)
          driver = webdriver.Chrome(executable_path=dest, chrome_options=options)
          return driver 

if __name__ == "__main__": 
      browser_driver =init_webdriver(True)
      browser_driver.get("https://connect.microsoft.com/site1304/Downloads") 
      print ("客户端会完成重定向，跳转到登录界面")

if "login." in browser_driver.current_url: 
      print("获取登录框元素")
      elem = browser_driver.find_element_by_name("loginfmt")
      print("清空登录框内容") 
      elem.clear() 
      print("在账户框中输出账号，并回车，完成页面跳转") 
      elem.send_keys("current_key:"+Keys.RETURN)

码农公寓

相关文章