目录
1. 强制等待
最简单粗暴的一种办法,无论程序是否加载完所需要的页面,都必须强制等待sleep(xx),参数为秒,需要导入time模块
from selenium import webdriver
from time import sleep
# 创建驱动
driver = webdriver.Chrome()
# 请求url
driver.get('https://www.baidu.com')
# 设置强行等待时间
sleep(3) # 强制等待3秒再执行下一步
# 打印网页源代码
print(driver.page_source)
driver.quit() # 退出驱动,关闭所有窗口
这种叫强制等待,不管你浏览器是否加载完了,程序都得等待3秒,3秒一到,继续执行下面的代码,如果3秒内未能加载出所需内容,则返回内容不包含想要的代码,作为调试很有用,有时候也可以在代码里这样等待,不过不建议总用这种等待方式,太死板,严重影响程序执行速度,还可能因为等待时间不够造成数据的缺失,效率最低。
2. 隐性等待
隐性等待等待是设置了一个最长等待时间,implicitly_wait(x),单位为秒,如果在规定时间内整个网页完全加载进来,则执行下一步,反之,抛出TimeoutException异常。
from selenium import webdriver
# 创建驱动
driver = webdriver.Chrome()
# 设置最长等待时间
driver.implicitly_wait(10) # 最长等待10秒
# 请求url
driver.get('https://www.baidu.com')
# 打印网页源代码
print(driver.page_source)
driver.close() # 关闭当前窗口
注意这里有一个弊端,那就是程序会一直等待整个页面加载完成,也就是一般情况下你看到浏览器标签栏那个小圈不再转,才会执行下一步,但有时候页面想要的元素早就在加载完成了,但是因为个别js之类的东西特别慢,我仍得等到页面全部完成才能执行下一步,效率较低
3. 显性等待
显性等待是设置了一个最长等待时间,使用WebDriverWait,并且配合该类的until()和until_not()方法,就能够根据判断条件而进行灵活地等待了。它主要的意思就是:程序每隔xx秒看一眼,如果条件成立了,则执行下一步,否则继续等待,直到超过设置的最长时间,然后抛出TimeoutException异常。
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC # selenium内置的条件判断
from selenium.webdriver.common.by import By
# 创建驱动
driver = webdriver.Firefox()
# 隐性等待和显性等待可以同时用,但要注意:等待的最长时间取两者之中的大者
driver.implicitly_wait(10)
# 请求url
driver.get('https://www.baidu.com')
# 确定定位器,定位器是一个元组类型的,元组的第一个元素为定位器的类型,需要从By模块中获取,如By.ID,By.XPATH,By.CSS,第二个元素为对应的定位器的语法
locator = (By.XPATH, '//*[@ID="root"]/div/div[2]/div[1]/div')
# 等到条件满足为止
wait.until(EC.presence_of_element_located(locator))
# 打印源代码
print(page_source)
# 关闭当前窗口
driver.close()
4、expected_conditions
expected_conditions是selenium的一个模块,其中包含一系列可用于判断的条件:
EC.title_is # 验证title,验证传入的参数title是否等于
EC.title_contains # 验证title,验证传入的参数title是否在driver.title中
EC.presence_of_element_located((By.CSS_SELECTOR,'.ui-page > wrap')) # 验证元素是否出现,传入的参数都是元组类型的locator,如(By.ID, 'kw'),只要一个符合条件的元素加载出来就通过;
EC.presence_of_all_elements_located((By.CSS_SELECTOR,'.ui-page')) # 验证元素是否出现,传入的参数都是元组类型的locator,如(By.ID, 'kw'),必须所有符合条件的元素都加载出来才行
EC.visibility_of_element_located # 验证元素是否可见,传入参数是元组类型的locator
EC.invisibility_of_element_located # 验证元素是否可见,传入参数是元组类型的locator
EC.visibility_of #验证元素是否可见,传入WebElement,第一个和第三个的实质是一样的
EC.text_to_be_present_in_element # 判断某段文本是否出现在某元素中,判断元素的text属性
EC.text_to_be_present_in_element_value # 判断某段文本是否出现在某元素中,判断元素的value属性
EC.frame_to_be_available_and_switch_to_it # 判断frame是否可切入,可传入locator元组或者直接传入定位方式:id、name、index或WebElement
EC.alert_is_present # 判断是否有alert出现
EC.element_to_be_clickable # 判断元素是否可点击,传入locator
EC.element_to_be_selected # 判断元素是否被选中,传入WebElement对象
EC.element_located_to_be_selected # 判断元素是否被选中,传入locator元组
EC.element_selection_state_to_be # 判断元素是否被选中,传入WebElement对象以及状态,相等返回True,否则返回False
EC.element_located_selection_state_to_be # 判断元素是否被选中,传入locator以及状态,相等返回True,否则返回False
EC.staleness_of # 判断一个元素是否仍在页面中,传入WebElement对象,可以判断页面是否刷新