Python+Selenium笔记(六):元素定位

 

(一)  前言

Web应用以及包含超文本标记语言(HTML)、层叠样式表(CSS)、JS脚本的WEB页面,基于用户的操作(例如点击提交按钮),浏览器向WEB服务器发送请求,WEB服务器响应请求,返回给浏览器HTML及相关的JS、CSS、图片等资源,浏览器使用这些资源生成WEB页面,其中包含WEB各种视觉元素,例如文本框、按钮、标签、图标、复选框、下拉框、图片等,这些视觉元素或控件都被Selenium称为页面元素(webelements)。

想要让Selenium执行我们想要的操作,首先必须让Selenium识别需要操作的元素,就像人通过眼睛去识别一样,Selenium通过定位元素的方法去识别页面元素,可以通过ID、

name、class属性定位,以及Xpth和CSS选择器定位,或者直接通过文本进行定位。

(二)  使用谷歌检查页面元素(根据自己的使用习惯选择浏览器)

(1)   单击鼠标右键,选择“检查”。

(2)   需要使用Xpth或CSS选择器时,可以在Elements窗口,Ctrl+F打开搜索框,在搜索框中输入Xpth或CSS表达式,匹配的元素会高亮显示(黄色部分),如果有多个匹配,搜索框的右侧会显示匹配数量。

Python+Selenium笔记(六):元素定位

(三)  元素定位

就如人工操作时,输入查询条件,然后点击【查询】按钮,前提是首先要知道这个是搜索框,这个是【查询】按钮一样,Selenium在执行功能操作之前,也要先识别这些元素。下面是Selenium提供的8种find_element_by 方法,用于定位页面元素。
方法
简单说明
find_element_by_id()
通过页面元素的id来定位
find_element_by_name()
通过页面元素的name来定位
find_element_by_class_name()
通过页面元素的class名来定位
find_element_by_tag_name()
通过页面元素的tag name(标签名称)来定位
例如:find_element_by_tag_name('input')
find_element_by_xpath()
通过Xpth来定位
find_element_by_css_selector()
通过CSS选择器来定位
例如:find_element_by_css_selector('#zzk_q')
find_element_by_link_text()
通过元素标签对之间的文本来定位
例如:find_element_by_link_text('园子')
find_element_by_partial_link_text()
通过元素标签对之间的部分文本来定位
例如:find_element_by_partial_link_text('ET技术')
 

(1)   如果加s(find_elements_by),就是返回一个列表(一组元素),不加的话就是返回一个元素,如果找不到元素就会抛出NoSuchElementException异常。

(2)   也可以用find_element(By.ID,'')这种写法,使用这种方式要先导入By模块

from selenium.webdriver.common.by import By

(3)   要使用CSS选择器,可以参考jquery 语法关于选择器的那部分

http://www.runoob.com/jquery/jquery-selectors.html

注:另外比较特殊的是class属性,class属性有空格时,空格并不是一般认识中的空格符号,而是代表这个标签有多个class名,定位的时候使用第一个名称,或者不同名称之间用.分开就行了。

例如:淘宝首页这个标签<div class="promo J_Promo tb-loading"></div>,可以用div.promo 或 div.promo.J_Promo 或 div.promo.J_Promo.tb-loading 定位

Python+Selenium笔记(六):元素定位

上一篇:Caffe 源碼閱讀(三) caffe.cpp


下一篇:Windows系统下PHP使用Redis