from selenium import webdriver
# 创建浏览器操作对象
browser = webdriver.Chrome("chromedriver.exe")
url = 'https://www.baidu.com/'
# 打开网页
browser.get(url)
# 获取源码
content = browser.page_source
print(content)
页面信息
# 页面标题
print(browser.title)
# 页面url
print(browser.current_url)
# 生成当前页面快照并保存
browser.save_screenshot("baidu.png")
# 获取页面cookie
print(browser.get_cookies())
# print(browser.get_cookie("name"))
元素信息
button = browser.find_element(By.ID, "su")
# 获取属性值
print(button.get_attribute('class'))
# 获取标签名
print(button.tag_name)
# 获取元素文本
a = browser.find_element(By.LINK_TEXT, "直播")
print(a.text)
元素定位
from selenium import webdriver
from selenium.webdriver.common.by import By
#根据id来找到对象
button = browser.find_element_by_id("su")
print(button)
#根据标签属性找到对象
button = browser.find_element_by_name("wd")
print(button)
#根据xpath语句获取对象
button = browser.find_element_by_xpath("//input[@id='su']")
print(button)
button = browser.find_elements_by_xpath("//input[@id='su']")
print(button)
#根据标签名字获取对象
button = browser.find_element_by_tag_name("input")
print(button)
#使用bs4语法获取对象
button = browser.find_element_by_css_selector("#su")
print(button)
#根据链接文本获取对象
button = browser.find_element_by_link_text('直播')
print(button)
定位方式 By
id By.ID
name By.NAME
class_name By.CLASS_NAME
tag_name By.TAG_NAME
link_text By.LINK_TEXT
partial_link_text By.PARTIAL_LINK_TEXT
css_selector By.CSS_SELECTOR
xpath By.XPA