文章目录
前言
每天我都在幻想,要是可以不上班还可以领钱,那生活该是多么美妙啊!这不到了冬天,对于我等夜猫子来说,每天早起打卡实在是痛不欲生,经常因为不想起床而麻烦小伙伴帮我打卡。终于我想起了曾经的杀手锏!一、Python+Selenium
Selenium 是一个用电脑模拟人操作浏览器网页,可以实现自动化的工具,估计很多小伙伴在学爬虫的时候有所了解。安装的步骤也很简单:
pip install selenium
#如果不行,就
sudo pip install selenium
#如果还不行,就
pip3 install selenium
#就
sudo pip3 install selenium
除了安装库之外,还要有selenium程序启动的浏览器,因此程序运行环境须要提前安装firefox
浏览器和下载geckodriver
wget https://github.com/mozilla/geckodriver/releases/download/v0.22.0/geckodriver-v0.22.0-linux64.tar.gz
各个版本的driver下载地址如下
https://github.com/mozilla/geckodriver/releases
tar zxvf geckodriver-v0.22.0-linux64.tar.gz
mv geckodriver /usr/local/bin
二、使用步骤
1.引入库
代码如下:
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
2.程序流程
- 打开网页;
- 识别出账号和密码框的位置并输入账号密码;
- 模拟点击登录
- 模拟点击打卡
3.具体代码
代码如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver import ActionChains
class LoginUrl(object):
#初始化类的属性
def __init__(self, driver, url, username, password):
self.__driver = driver
self.__url = url
self.__username = username
self.__password = password
#打开网页的方法
def openwebsite(self):
self.__driver.maximize_window()
self.__driver.get(self.__url)
#输入网页账号
def inputusername(self, find_element_method, element):
if(find_element_method == "id"):
WebDriverWait(self.__driver, 10).until(EC.presence_of_element_located((By.ID, element)))#等待10s,每500ms查询一次,直到元素加载完毕或超过10s结束
usrName = self.__driver.find_element_by_id(element)
elif(find_element_method == "name"):
WebDriverWait(self.__driver, 10).until(EC.presence_of_element_located((By.NAME, element)))
usrName = self.__driver.find_element_by_name(element)
elif(find_element_method == "xpath"):
WebDriverWait(self.__driver, 10).until(EC.presence_of_element_located((By.XPATH, element)))
usrName = self.__driver.find_element_by_xpath(element)
else:
print("find element error!")
usrName.send_keys(self.__username)
#输入网页密码
def inputpassword(self, find_element_method, element):
if(find_element_method == "id"):
WebDriverWait(self.__driver, 10).until(EC.presence_of_element_located((By.ID, element)))
passWrd = self.__driver.find_element_by_id(element)
elif(find_element_method == "name"):
WebDriverWait(self.__driver, 10).until(EC.presence_of_element_located((By.NAME, element)))
passWrd = self.__driver.find_element_by_name(element)
elif(find_element_method == "xpath"):
WebDriverWait(self.__driver, 10).until(EC.presence_of_element_located((By.XPATH, element)))
passWrd = self.__driver.find_element_by_xpath(element)
else:
print("find element error!")
passWrd.send_keys(self.__password)
#点击登陆
def clicksubmit(self, find_element_method, element):
if(find_element_method == "id"):
WebDriverWait(self.__driver, 5).until(EC.presence_of_element_located((By.ID, element)))
self.__driver.find_element_by_id(element).click()
elif(find_element_method == "name"):
WebDriverWait(self.__driver, 5).until(EC.presence_of_element_located((By.NAME, element)))
self.__driver.find_element_by_name(element).click()
elif(find_element_method == "xpath"):
WebDriverWait(self.__driver, 5).until(EC.presence_of_element_located((By.XPATH, element)))
self.__driver.find_element_by_xpath(element).click()
else:
print( "find element error!")
#test
def test(self, find_element_method, element):
ActionChains(self.__driver).move_to_element(self.__driver.find_element_by_xpath(element)).perform()
self.__driver.find_element_by_xpath(element).click()
def main():
#登录打卡的网站
browser1 = webdriver.Firefox()
giga = LoginUrl(browser1, "http://xxxxxxxxxx/index.html", u"你的账户名", u"你的密码")
giga.openwebsite()
# 输入账号
giga.inputusername("id", "loginid")
# 输入密码
giga.inputpassword("id", "userpassword")
# 点击登录
giga.clicksubmit("xpath", "/html/body/div[@id='container']/div[@id='LoginContainer']/div[@class='e9login-content']/div[@class='e9login-element e9login-btn']/div[@class='e9login-form-submit e9login-submit']/button[@id='submit']")
# 等待完成
time.sleep(3)
# 点击考勤
giga.clicksubmit("xpath", "/html/body/div[@id='container']/div/div[@class='e9theme-layout-container ']/div[@class='e9theme-layout-header']/div[@class='e9header-container wea-f12']/div[@class='e9header-right']/div[@class='e9header-right-toolbar']/div[@id='signPlugin']/div[@class='singBtn']/span")
# 等待完成
time.sleep(3)
# 更新打卡时间,之前出问题是应为Xphth写的问题,简化之后就好了
giga.test("xpath", "//a[@class='resign']")
print("succeess...")
if __name__ == "__main__":
main()
4.代码解释
- 从main函数开始,首先登录网站,使用你自己的网站、用户名和密码来替换代码中的部分,正常情况我们手动登录的时候,由于cookie的问题,不需要我们重复输入,但是这里是调用还是需要重新输入的。
- 接下来是输入账号和输入密码,参数“id”和“loginid‘这个并不是通用的,需要先手动登录网站,使用F12开发人员工具,查看网站的源代码,找到对应的标签。只需要在你的登录框处右击-》检查,就可以看到对应的源代码,如果代码中可以看到”id“标签和对应的值,就可以通过id来查找,同理,如果具有”name“标签和对应的值,也可以使用name查找。如果两者都没有,还可以通过Xpath来查找,这种方法具体请看第五节说明,完全不需要懂,有专门的工具帮助实现。
- 账户和密码填写框的实现逻辑应该比较类似,都提供了三种定位方法,id标签、name标签和粗暴的Xpath定位。
- 当程序通过三种方法中的某种方法定位到账号密码框时,就需要程序帮我们填写账号和密码,也就是
usrName.send_keys(self.__username)
和passWrd.send_keys(self.__password)
- 填写好文本之后,那自然就是点击登录按钮了,这次使用个不同的方法,也就是简单粗暴的Xpath大法,第二个参数一大串其实就是通过专门的工具生成的,直接拷贝进来就能用
- 剩下的点击考勤,点击打卡等等操作就是具体的点击步骤了,不同网站的顺序和方式不太一样,但是对于只需要点击的,实现的逻辑是一样的
5.Xpath使用介绍
1.下载文件xpath-helper.crx,链接:https://pan.baidu.com/s/1dFgzBSd 密码:zwvb,感谢网友
2.在Google浏览器或者Edge浏览器里边找到这个“扩展程序”选项菜单即可。
3.然后就会进入到扩展插件的界面了,把下载好的离线插件xpath-helper.crx拖动到这个扩展界面便可以了,它会有提示,松开鼠标即可。
4.添加成功后,可以用快捷键Ctrl+shift+x来调出界面编写xpath, 再按一次就会关掉,打开xpath插件,按住shift,用鼠标点击网页上的所有元素,就会自动生成对于的xpath元素,拷贝粘贴即可食用。
总结
对于复杂的xpath,直接复制粘贴可能导致程序定位元素失败,这时候可能需要简化xpath helper生成的东西,如何简化呢,例如/html/body/div[@id='container']/div[@id='LoginContainer']/div[@class='e9login-content']/div[@class='e9login-element e9login-btn']/div[@class='e9login-form-submit e9login-submit']/button[@id='submit']
直接简写成//button[@id='submit']