安装selenium
安装命令: pip install selenium
测试
打开一款Python编辑器,默认Python自带的IDLE也行。创建 baidu.py文件,输入以下内容:
from selenium import webdriver driver = webdriver.Chrome()
driver.get('https://www.baidu.com') print(driver.title) driver.quit()
如果执行报错, 请看下面
selenium3 浏览器驱动:
下载浏览器驱动
当selenium升级到3.0之后,对不同的浏览器驱动进行了规范。如果想使用selenium驱动不同的浏览器,必须单独下载并设置不同的浏览器驱动
各浏览器下载地址:
Firefox浏览器驱动:geckodriver
Chrome浏览器驱动:chromedriver , taobao备用地址
IE浏览器驱动:IEDriverServer
Edge浏览器驱动:MicrosoftWebDriver
Opera浏览器驱动:operadriver
PhantomJS浏览器驱动:phantomjs
设置浏览器驱动
设置浏览器的地址非常简单 我们可以手动创建一个存放浏览器驱动的目录,如: C:\driver , 将下载的浏览器驱动文件(例如:chromedriver、geckodriver)丢到该目录下
我的电脑-->属性-->系统设置-->高级-->环境变量-->系统变量-->Path,将“C:\driver”目录添加到Path的值中
- Path
- C:\driver
设置浏览器驱动
验证不同的浏览器驱动是否正常使用
from selenium import webdriver driver = webdriver.Firefox() # Firefox浏览器 driver = webdriver.Chrome() # Chrome浏览器 driver = webdriver.Ie() # Internet Explorer浏览器 driver = webdriver.Edge() # Edge浏览器 driver = webdriver.Opera() # Opera浏览器 driver = webdriver.PhantomJS() # PhantomJS
selenium定位方法
selenium提供了八种定位方式:
id
name
class name
tag name
link text
partial link text
xpath
css selector
这八种定位方式在python selenium中所对应的方法为:
find_element_by_id()
find_element_by_id_name
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()
定位方法的用法
<html>
<head>
<body link="#0000cc">
<a id="result_logo" href="/" onmousedown="return c({'fm':'tab','tab':'logo'})">
<form id="form" class="fm" name="f" action="/s">
<span class="soutu-btn"></span>
<input id="kw" class="s_ipt" name="wd" value="" maxlength="255" autocomplete="off">
我们的目的是要定位input标签的输入框
通过id找
dr.find_element_by_id("kw")
通过name定位
dr.find_element_by_name("wd")\
通过class_name定位:
dr.find_element_by_class_name("s_ipt")
通过tag name定位:
dr.find_element_by_tag_name("input")
通过xpath定位,xpath定位有N种写法,这里列几个常用写法:
dr.find_element_by_xpath("//[@id='kw']")
dr.find_element_by_xpath("//[@name='wd']")
dr.find_element_by_xpath("//input[@class='s_ipt']")
dr.find_element_by_xpath("/html/body/form/span/input")
dr.find_element_by_xpath("//span[@class='soutu-btn']/input")
dr.find_element_by_xpath("//form[@id='form']/span/input")
dr.find_element_by_xpath("//input[@id='kw' and @name='wd']")
通过css定位, css定位有N种写法, 这里列举几个常用的写法:
dr.find_element_by_css_selector("#kw")
dr.find_element_by_css_selector("[name=wd]")
dr.find_element_by_css_selector(".s_ipt")
dr.find_element_by_css_selector("html > body > form > span > input")
dr.find_element_by_css_selector("span.soutu-btn> input#kw")
dr.find_element_by_css_selector("form#form > span > input")
接下来,我们的页面上有一组文本链接。
<a class="mnav" href="http://news.baidu.com" name="tj_trnews">新闻</a>
<a class="mnav" href="http://www.hao123.com" name="tj_trhao123">hao123</a>
通过link text定位:
dr.find_element_by_link_text("新闻")
dr.find_element_by_link_text("hao123")
通过link text 定位
dr.find_element_by_partial_link_text("新")
dr.find_element_by_partial_link_text("hao")
dr.find_element_by_partial_link_text("123")
点击和输入
上面已经说了定位元素, 定位只是第一步 定位之后需要对这个元素进行操作, 或单击(按钮) 或输入(输入框) 下面就来认识webdriver中最常用的几个方法:
clear(): 清除文本
send_keys (value): 模拟按键输入
click(): 单击元素
from selenium import webdriver driver = webdriver.Chrome()
driver.get("https://www.baidu.com") driver.find_element_by_id("kw").clear()
driver.find_element_by_id("kw").send_keys("selenium")
driver.find_element_by_id("su").click() driver.quit()
提交
- submit()
submit()方法用于提交表单 例如, 在搜索框输入关键字之后的“回车” 操作, 就可以通过该方法模拟
from selenium import webdriver driver = webdriver.Chrome()
driver.get("https://www.baidu.com") search_text = driver.find_element_by_id('kw')
search_text.send_keys('selenium')
search_text.submit() driver.quit()
注意: 有时候submit() 可以与click() 方法互换来使用, submit() 同样可以提交一个按钮, 但submit() 的应用范围远不及 click() 广泛
其他常用方法
size: 返回元素的尺寸
text: 获取元素的文本
get_attribute(name): 获得属性值
is_displayed(): 设置该元素是否用户可见
from selenium import webdriver driver = webdriver.Chrome()
driver.get("http://www.baidu.com") # 获得输入框的尺寸
size = driver.find_element_by_id('kw').size
print(size) # 返回百度页面底部备案信息
text = driver.find_element_by_id("cp").text
print(text) # 返回元素的属性值, 可以是 id、 name、 type 或其他任意属性
attribute = driver.find_element_by_id("kw").get_attribute('type')
print(attribute) # 返回元素的结果是否可见, 返回结果为 True 或 False
result = driver.find_element_by_id("kw").is_displayed()
print(result) driver.quit()输出
输出结果:
{'width': 500, 'height': 22}
©2015 Baidu 使用百度前必读 意见反馈 京 ICP 证 030173 号
text
True
执行上面的程序并查看结果: size 方法用于获取百度输入框的宽、 高, text 方法用于获得百度底部的备案信息, get_attribute()用于获得百度输入的 type 属性的值, is_displayed()用于返回一个元素是否可见 如果可见则返回 True 否则返回 False
鼠标事件:
在 WebDriver 中, 将这些关于鼠标操作的方法封装在 ActionChains 类提供。
ActionChains 类提供了鼠标操作的常用方法:
perform(): 执行所有 ActionChains 中存储的行为
context_click(): 右击
double_click(): 双击
drag_and_drop(): 拖动
move_to_element(): 鼠标悬停
鼠标悬停操作:
from selenium import webdriver
# 引入 ActionChains 类
from selenium.webdriver.common.action_chains import ActionChains driver = webdriver.Chrome()
driver.get("https://www.baidu.cn") # 定位到要悬停的元素
above = driver.find_element_by_link_text("设置")
# 对定位到的元素执行鼠标悬停操作
ActionChains(driver).move_to_element(above).perform() ……
- from selenium.webdriver import ActionChains
导入提供鼠标操作的 ActionChains 类
- ActionChains(driver)
调用 ActionChains()类, 将浏览器驱动 driver 作为参数传入
- move_to_element(above)
context_click()方法用于模拟鼠标右键操作 在调用时需要指定元素定位
- perform()
执行所有 ActionChains 中存储的行为 可以理解成是对整个操作的提交动作
键盘事件:
Keys()类提供了键盘上几乎所有按键的方法 前面了解到 send_keys()方法可以用来模拟键盘输入, 除此 之外, 我们还可以用它来输入键盘上的按键, 甚至是组合键, 如 Ctrl+A、 Ctrl+C 等
from selenium import webdriver
# 引入 Keys 模块
from selenium.webdriver.common.keys import Keys driver = webdriver.Chrome()
driver.get("http://www.baidu.com") # 输入框输入内容
driver.find_element_by_id("kw").send_keys("seleniumm") # 删除多输入的一个 m
driver.find_element_by_id("kw").send_keys(Keys.BACK_SPACE) # 输入空格键+“教程”
driver.find_element_by_id("kw").send_keys(Keys.SPACE)
driver.find_element_by_id("kw").send_keys("教程") # ctrl+a 全选输入框内容
driver.find_element_by_id("kw").send_keys(Keys.CONTROL, 'a') # ctrl+x 剪切输入框内容
driver.find_element_by_id("kw").send_keys(Keys.CONTROL, 'x') # ctrl+v 粘贴内容到输入框
driver.find_element_by_id("kw").send_keys(Keys.CONTROL, 'v') # 通过回车键来代替单击操作
driver.find_element_by_id("su").send_keys(Keys.ENTER)
driver.quit()
需要说明的是, 上面的脚本没有什么实际意义, 仅向我们展示模拟键盘各种按键与组合键的用法
- from selenium.webdriver.common.keys import Keys
在使用键盘按键方法前需要先导入 keys 类
以下为常用的键盘操作:
send_keys(Keys.BACK_SPACE) 删除键(BackSpace)
send_keys(Keys.SPACE) 空格键(Space)
send_keys(Keys.TAB) 制表键(Tab)
send_keys(Keys.ESCAPE) 回退键(Esc)
send_keys(Keys.ENTER) 回车键(Enter)
send_keys(Keys.CONTROL,'a') 全选(Ctrl+A)
send_keys(Keys.CONTROL,'c') 复制(Ctrl+C)
send_keys(Keys.CONTROL,'x') 剪切(Ctrl+X)
send_keys(Keys.CONTROL,'v') 粘贴(Ctrl+V)
send_keys(Keys.F1) 键盘 F1
……
send_keys(Keys.F12) 键盘 F12
获取断言信息:
不管是在做功能测试还是自动化测试,最后一步需要拿实际结果与预期进行比较。这个比较的称之为断言
我们通常可以通过获取title 、URL和text等信息进行断言 text方法在前面已经讲过,它用于获取标签对之间的文本信息 下面同样以百度为例,介绍如何获取这些信息
from selenium import webdriver
from time import sleep driver = webdriver.Firefox()
driver.get("https://www.baidu.com") print('Before search================') # 打印当前页面title
title = driver.title
print(title) # 打印当前页面URL
now_url = driver.current_url
print(now_url) driver.find_element_by_id("kw").send_keys("selenium")
driver.find_element_by_id("su").click()
sleep(1) print('After search================') # 再次打印当前页面title
title = driver.title
print(title) # 打印当前页面URL
now_url = driver.current_url
print(now_url) # 获取结果数目
user = driver.find_element_by_class_name('nums').text
print(user) driver.quit()
脚本运行结果如下:
Before search================
百度一下,你就知道
https://www.baidu.com/
After search================
selenium_百度搜索
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx...
搜索工具
百度为您找到相关结果约5,380,000个
title:用于获得当前页面的标题
current_url:用户获得当前页面的URL
text:获取搜索条目的文本信息
设置元素等待:
WebDriver提供了两种类型的等待:显式等待和隐式等待
显示等待
显式等待使WebdDriver等待某个条件成立时继续执行,否则在达到最大时长时抛出超时异常(TimeoutException)
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Firefox()
driver.get("http://www.baidu.com") element = WebDriverWait(driver, 5, 0.5).until(
EC.presence_of_element_located((By.ID, "kw"))
)
element.send_keys('selenium')
driver.quit()
WebDriverWait类是由WebDirver 提供的等待方法 在设置时间内,默认每隔一段时间检测一次当前页面元素是否存在,如果超过设置时间检测不到则抛出异常 具体格式如下:
WebDriverWait(driver, timeout, poll_frequency=0.5, ignored_exceptions=None)
driver :浏览器驱动
timeout :最长超时时间,默认以秒为单位
poll_frequency :检测的间隔(步长)时间,默认为0.5S
ignored_exceptions :超时后的异常信息,默认情况下抛NoSuchElementException异常
WebDriverWait()一般由until()或until_not()方法配合使用,下面是until()和until_not()方法的说明
- until(method, message=‘’)
调用该方法提供的驱动程序作为一个参数,直到返回值为True
- until_not(method, message=‘’)
调用该方法提供的驱动程序作为一个参数,直到返回值为False
在本例中,通过as关键字将expected_conditions 重命名为EC,并调用presence_of_element_located()方法判断元素是否存在
隐式等待:
WebDriver提供了implicitly_wait()方法来实现隐式等待,默认设置为0。它的用法相对来说要简单得多
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from time import ctime driver = webdriver.Firefox() # 设置隐式等待为10秒
driver.implicitly_wait(10)
driver.get("http://www.baidu.com") try:
print(ctime())
driver.find_element_by_id("kw22").send_keys('selenium')
except NoSuchElementException as e:
print(e)
finally:
print(ctime())
driver.quit()
implicitly_wait()
默认参数的单位为秒,本例中设置等待时长为10秒 首先这10秒并非一个固定的等待时间,它并不影响脚本的执行速度 其次,它并不针对页面上的某一元素进行等待 当脚本执行到某个元素定位时,如果元素可以定位,则继续执行;如果元素定位不到,则它将以轮询的方式不断地判断元素是否被定位到 假设在第6秒定位到了元素则继续执行,若直到超出设置时长(10秒)还没有定位到元素,则抛出异常
定位一组元素
WebDriver还提供了8种用于定位一组元素的方法
find_elements_by_id()
find_elements_by_name()
find_elements_by_class_name()
find_elements_by_tag_name()
find_elements_by_link_text()
find_elements_by_partial_link_text()
find_elements_by_xpath()
find_elements_by_css_selector()
定位一组元素的方法与定位单个元素的方法类似,唯一的区别是在单词element后面多了一个s表示复数
接下来通过例子演示定位一组元素的使用:
from selenium import webdriver
from time import sleep driver = webdriver.Chrome()
driver.get("https://www.baidu.com") driver.find_element_by_id("kw").send_keys("selenium")
driver.find_element_by_id("su").click()
sleep(1) # 定位一组元素
texts = driver.find_elements_by_xpath('//div/h3/a') # 循环遍历出每一条搜索结果的标题
for t in texts:
print(t.text) driver.quit()
程序运行结果:
Selenium - Web Browser Automation
官网
功能自动化测试工具——Selenium篇
selenium + python自动化测试环境搭建 - 虫师 - 博客园
selenium是什么?_百度知道
怎样开始用selenium进行自动化测试(个人总结)_百度经验
Selenium_百度百科
selenium_百度翻译
Selenium官网教程_selenium自动化测试实践_Selenium_领测软件测试网
Selenium(浏览器自动化测试框架)_百度百科
自动化基础普及之selenium是啥? - 虫师 - 博客园
python十大主流开源框架 「菜鸟必看」
多表单切换
在Web应用中经常会遇到frame/iframe表单嵌套页面的应用,WebDriver只能在一个页面上对元素识别与定位,对于frame/iframe表单内嵌页面上的元素无法直接定位 这时就需要通过switch_to.frame()方法将当前定位的主体切换为frame/iframe表单的内嵌页面中
<html>
<body>
...
<iframe id="x-URS-iframe" ...>
<html>
<body>
...
<input name="email" >
126邮箱登录框的结构大概是这样子的,想要操作登录框必须要先切换到iframe表单
from selenium import webdriver driver = webdriver.Chrome()
driver.get("http://www.126.com") driver.switch_to.frame('x-URS-iframe')
driver.find_element_by_name("email").clear()
driver.find_element_by_name("email").send_keys("username")
driver.find_element_by_name("password").clear()
driver.find_element_by_name("password").send_keys("password")
driver.find_element_by_id("dologin").click()
driver.switch_to.default_content() driver.quit()
switch_to.frame()
默认可以直接取表单的id 或name属性 如果iframe没有可用的id和name属性,则可以通过下面的方式进行定位
#先通过xpth定位到iframe
xf = driver.find_element_by_xpath('//*[@id="x-URS-iframe"]') #再将定位对象传给switch_to.frame()方法
driver.switch_to.frame(xf)
……
driver.switch_to.parent_frame()
除此之外,在进入多级表单的情况下,还可以通过switch_to.default_content()
跳回最外层的页面
多窗口切换
在页面操作过程中有时候点击某个链接会弹出新的窗口,这时就需要主机切换到新打开的窗口上进行操作 WebDriver提供了switch_to.window()方法,可以实现在不同的窗口之间切换 以百度首页和百度注册页为例,在两个窗口之间的切换如下图
from selenium import webdriver
import time driver = webdriver.Firefox()
driver.implicitly_wait(10)
driver.get("http://www.baidu.com") # 获得百度搜索窗口句柄
sreach_windows = driver.current_window_handle driver.find_element_by_link_text('登录').click()
driver.find_element_by_link_text("立即注册").click() # 获得当前所有打开的窗口的句柄
all_handles = driver.window_handles # 进入注册窗口
for handle in all_handles:
if handle != sreach_windows:
driver.switch_to.window(handle)
print('now register window!')
driver.find_element_by_name("account").send_keys('username')
driver.find_element_by_name('password').send_keys('password')
time.sleep(2)
# …… driver.quit()
在本例中所涉及的新方法如下:
current_window_handle:获得当前窗口句柄
window_handles:返回所有窗口的句柄到当前会话
switch_to.window():用于切换到相应的窗口,与上一节的switch_to.frame()类似,前者用于不同窗口的切换,后者用于不同表单之间的切换
警告框处理
在WebDriver中处理JavaScript所生成的alert、confirm以及prompt十分简单,具体做法是使用 switch_to.alert 方法定位到 alert/confirm/prompt,然后使用text/accept/dismiss/ send_keys等方法进行操作
text:返回 alert/confirm/prompt 中的文字信息
accept():接受现有警告框
dismiss():解散现有警告框
send_keys(keysToSend):发送文本至警告框 keysToSend:将文本发送至警告框
如下图,百度搜索设置弹出的窗口是不能通过前端工具对其进行定位的,这个时候就可以通过switch_to_alert()方法接受这个弹窗4
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time driver = webdriver.Firefox()
driver.implicitly_wait(10)
driver.get('http://www.baidu.com') # 鼠标悬停至“设置”链接
link = driver.find_element_by_link_text('设置')
ActionChains(driver).move_to_element(link).perform() # 打开搜索设置
driver.find_element_by_link_text("搜索设置").click() # 保存设置
driver.find_element_by_class_name("prefpanelgo").click()
time.sleep(2) # 接受警告框
driver.switch_to.alert.accept() driver.quit()
通过switch_to_alert()方法获取当前页面上的警告框,并使用accept()方法接受警告框
下拉框选择
有时我们会碰到下拉框,WebDriver提供了Select类来处理下拉框 如百度搜索设置的下拉框,如下图:
from selenium import webdriver
from selenium.webdriver.support.select import Select
from time import sleep driver = webdriver.Chrome()
driver.implicitly_wait(10)
driver.get('http://www.baidu.com') # 鼠标悬停至“设置”链接
driver.find_element_by_link_text('设置').click()
sleep(1)
# 打开搜索设置
driver.find_element_by_link_text("搜索设置").click()
sleep(2) # 搜索结果显示条数
sel = driver.find_element_by_xpath("//select[@id='nr']")
Select(sel).select_by_value('50') # 显示50条
# …… driver.quit()select
select类用于定位select标签
select_by_value() 方法用于定位下接选项中的value值