XPATH是什么
XPATH是一门在XML文档中查找信息的语言,XPATH可用来在XML文档中对元素和属性进行遍历,主流的浏览器都支持XPATH,因为HTML页面在DOM中表示为XHTML文档。Selenium WebDriver支持使用XPATH表达式来定位元素。
Xpath常用如下6种定位元素的方法:
1、通过绝对路径定位
绝对路径的开头是一个斜线(/),从网页的根节点html开始,逐层去查找需要定位的元素。
此方法缺点显而易见,当页面元素位置发生改变时,都需要修改,因此,并不推荐使用。
代码如下:
以百度首页的搜索框为例
import os from selenium import webdriver from selenium.webdriver.common.by import By current_path = os.path.dirname(os.path.abspath(__file__)) # 当前路径 driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe') # driver路径 driver = webdriver.Chrome(executable_path=driver_path) # Firefox,Ie等 driver.get('https://www.baidu.com/') # 打开网站 # 绝对路径定位:/ 开头 # 从网页正文的html节点,一直找到元素所在的位置的一种定位方法(从上往下,同层级下标表示) # 一般不用,难维护,谷歌浏览器自带了复制 绝对路径xpath的功能 driver.find_element(By.XPATH,'/html/body/div[1]/div[1]/div[5]/div/div/form/span[1]/input').send_keys('python')
备注:当同一层次有多个相同的元素时,使用下标区分,下标从1开始;并且注意网页登录状态和非登录状态的html的绝对路径是不一样的
2、通过相对路径定位
相对路径的开头是两个斜线(//),表示文件中所有符合模式的元素都会被选出来,即使是处于树中不同的层级也会被选出来。
代码如下:
以百度首页的搜索框为例
import os from selenium import webdriver from selenium.webdriver.common.by import By current_path = os.path.dirname(os.path.abspath(__file__)) # 当前路径 driver_path = os.path.join(current_path,'../webdriver/chromedriver.exe') # driver路径 driver = webdriver.Chrome(executable_path=driver_path) # Firefox,Ie等 driver.get('https://www.baidu.com/') # 打开网站 # 相对路径定位:// 开头 # 在网页正文中,通过独一无二丶局部路径表示元素信息的一种定位方法(从下往上,一层一层试) driver.find_element(By.XPATH,'//span[1]/input').send_keys('JAVA') # 最简相对路径 driver.find_element(By.XPATH,'//form/span[1]/input').send_keys('JAVA') # 最简相对路径
备注:以上都可以定位到百度搜索框,相对路径的长度和开始位置并不受限制,可以采用从后往前逐层定位直到定位到即可的方式去定位。
3、通过元素索引定位
遇到同层级相同标签元素时,可以使用索引(下标)表示,索引的初始值为1