带有界面的12306！无限自动查询并购票的脚本！年关买票了吗

2024-04-09 18:53:41
分享记录一个带有GUI界面的12306(默认二等座)无限自动查询并购票的脚本(购票成功发送邮件)

from tkinter import * #编写GUI界面
import threading  #引入线程,解决GUI堵塞
from selenium import webdriver
#导入显式等待相关库
from selenium.webdriver.support.ui import WebDriverWait
#导入显式等待条件语句库
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By #后面的until()必须元组形式，所以导入By
#导入csv模块来读取站点代号
import  csv
#导入表单下滑选项操作的库
from selenium.webdriver.support.ui import Select
#导入可能出现的异常
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import ElementNotVisibleException
from selenium.common.exceptions import StaleElementReferenceException
from selenium.common.exceptions import ElementNotInteractableException
#导入时间模块进行等待
from time import sleep
#导入发送邮件模块
import yagmail


"""将driver放在外面的原因是：
   如果放在里面，那么driver将会随着对象的销毁而销毁
   而我们的类TrainSpider的实例对象是放在main()函数中执行的
   只要main()函数运行完成后，里面所有的变量都会被销毁
   也就说spider类实例对象也会被销毁
"""

#初始化GUI界面
root = Tk()
root.title('Carson的12306购票器')
root.geometry('400x350')
#初始化基本GUI界面的组件
lb1 = Label(root,text = '欢迎使用Carson的12306二等座购票器',font=('Arial', 14))
lb1.place(relx = 0.08,rely=0.02)
lb2 = Label(root,text = '乘车人员:',font=('Arial', 12))
lb2.place(x = 45,y = 45)
lb3 = Label(root,text = '出发日期:',font=('Arial', 12))
lb3.place(x = 45,y = 78)
lb4 = Label(root,text = '出发车站:',font=('Arial', 12))
lb4.place(x = 45,y = 111)
lb5 = Label(root,text = '终点车站:',font=('Arial', 12))
lb5.place(x = 45,y = 144)
lb6 = Label(root,text = '购买车次:',font=('Arial', 12))
lb6.place(x = 45,y = 177)
lb7 = Label(root,text = '购票信息如下:',font=('Arial', 12))
lb7.place(x = 0,y = 205)
text = Text(root,height = 5,width=56)
text.place(x = 0,y= 232)
entry1_str = StringVar()
entry1_str.set('输入乘车人的姓名,如:张三')
entry1 = Entry(root,textvariable = entry1_str,)
entry1.place(x = 120,y = 46,height=28,width=160)
entry2_str = StringVar()
entry2_str.set('输入出发日期,格式如:2021-01-16')
entry2 = Entry(root,textvariable = entry2_str,)
entry2.place(x = 120,y = 79,height=28,width=190)
entry3_str = StringVar()
entry3_str.set('输入起始站,如:深圳北')
entry3 = Entry(root,textvariable = entry3_str)
entry3.place(x = 120,y = 112,height=28,width=160)
entry4_str = StringVar()
entry4_str.set('输入终点站,如:潮阳')
entry4 = Entry(root,textvariable = entry4_str)
entry4.place(x = 120,y = 145,height=28,width=160)
entry5_str = StringVar()
entry5_str.set('输入车次,格式如:G6006 D1234')
entry5 = Entry(root,textvariable = entry5_str)
entry5.place(x = 120,y = 178,height=28,width=180)
class TrainSpider:  
    #将属性放类里面定义为类属性
    login_url = 'https://kyfw.12306.cn/otn/resources/login.html' #二维码登陆界面url
    personal_url = 'https://kyfw.12306.cn/otn/view/index.html'  #登陆后进入的个人中心url
    left_ticket_url = 'https://kyfw.12306.cn/otn/leftTicket/init?linktypeid=dc' #查询车次和余票的url
    confirm_passenger_url = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc' #确认乘客信息的url
    
    def __init__(self,from_station,to_station,train_date,trains,passengers,driver):
        """
        :param from_station:  起始车站
        :param to_station: 目的地车站
        :param train_date: 出发日期
        :param trains: 需要购买的车次。需要字典形式，形式如：{“G529”:["O","M"],"G403":["O","M"]}多车次就多个键值对
        :param passengers: 需要买票的乘车人，需要为一个列表
        """
        self.driver = driver
        self.from_station = from_station
        self.to_station = to_station
        self.train_date = train_date
        self.trains = trains
        self.passengers = passengers
        self.current_number = None #定义一下变量保存下当前预定的车次序号信息
        self.current_seat = None #定义一下变量保存下当前选中的车次的选中的席位信息
        #为了方便根据站名文字来取得车站代号，需要创建字典存储代号数据
        #且空集合的创建要在函数外，不然执行完函数集合数据就没有了
        self.station_codes = {}
        #初始化站点代号数据
        self.get_station_codes()


    #获取车站代码
    #这里需要本地有一个station.csv的车站对应代码的文件
    def get_station_codes(self):
        #读取数据并存放到空字典中
        with open('stations.csv', 'r', encoding='utf-8') as fp:
            reader = csv.DictReader(fp)
            for line in reader:
                name = line['name']
                code = line['code']
                self.station_codes[name] = code


    #实现登陆功能
    def login(self):
        self.driver.maximize_window() #最大化窗口
        # 将属性放类里面定义为类属性,调用时需要加self进行调用
        self.driver.get(self.login_url)
        # 进行显式等待(有条件)设置100秒，且用来判断是否登陆成功
        # 即后面判断条件是url是否变化成个人中心的url
        WebDriverWait(self.driver, 100).until(
            EC.url_to_be(self.personal_url)  # 注意类中变量调用加self
            #或者EC.url_contains(self.personal_url)
        )
        print('登陆成功!')
        print('开始刷票！')


    #查询车次余票
    def search_left_tickets(self):
        self.driver.get(self.left_ticket_url)
        """起始站的代号设置"""
        from_station_input = self.driver.find_element_by_id('fromStation')
        #利用用户输入文字获取起始站的代号
        from_station_code = self.station_codes[self.from_station]
        #通过js代码修改隐藏标签的value值来达到输入起始站的目的
        self.driver.execute_script("arguments[0].value = '%s'"%from_station_code,from_station_input)
        """终点站的代号设置"""
        to_station_input = self.driver.find_element_by_id('toStation')
        to_station_code = self.station_codes[self.to_station]
        self.driver.execute_script("arguments[0].value = '%s'"%to_station_code,to_station_input)
        """日期设置"""
        #这里没有前面两个复杂，没有被隐含，理论上标签send_keys即可
        #但可能也像前面两个输入框一样被处理过，故输入时间也才用执行js代码的方式
        train_date_input = self.driver.find_element_by_xpath('//*[@id="train_date"]') #xpath*表任意
        self.driver.execute_script("arguments[0].value = '%s'" % self.train_date, train_date_input)
        """执行查询操作"""
        search_button = self.driver.find_element_by_id('query_ticket').click()
        print("第1次查询中...")
        # 因为点击查询按钮后需等待一下才会返回列车车次数据
        # 所以在解析具体的车次信息前需要设置等待,采用显示等待(条件即加载出tbody下的tr标签)
        """注意,在until(EC.presence_of_element_located())中
        验证元素是否出现，传入的参数必须都是元组类型的locator，如(By.ID, ‘kw’)，
        不能传入webelement对象，即driver.find_elemet_by_id()的写法不行会报错
        """
        # 设置1000秒显式等待有各个列车信息的tr标签出现(一般开售前5分种即5*60=300秒足够了）
        WebDriverWait(self.driver, 1000).until(
            # 条件判断是某元素即tr标签是否出现，注意..located()里面是元组类型的locator，必须如下写法
            EC.presence_of_element_located((By.XPATH, '//*[@id="queryLeftTable"]/tr'))
        )
        # 注意有许多车次对应许多的tr标签，注意用elements返回列表
        # 且注意对第二个tr标签利用xpath里面的not(@属性名)过滤掉
        trains = self.driver.find_elements_by_xpath('//tbody[@id="queryLeftTable"]/tr[not(@datatran)]')
        #添加一个布尔标志，用于判断所选车次是否有票再去查询
        is_searched = False
        n =1
        #添加死循环，直到数据符合条件才退出
        while True:
            for train in trains:
                # 利用text打印出标签里面关于车次信息的文本即可
                # 由于刚打印出来的数据之间都是换行的，现在将其替换空格放成同一行
                # 调用split()，以空格进行分割，分割上面替换后的字符串,会返回列表形式的车次的所有信息
                infos = train.text.replace("\n", ' ').split(' ')
                # 从返回的车次列表信息中提取出车次序号数据
                number = infos[0]
                # 判断提取的车次序号数据(number)有没有在用户要的车次字典的里面
                # 是的话再判断有无席位的信息再去预定,
                if number in self.trains:  # 注意self.trains我们已定义是字典，{“G529":["O"."M"]}
                    seat_types = self.trains[number]  # 根据numer的键取得定义字典的座席类型
                    # 取得的座位类型是列表，需要for循环遍历
                    for seat_type in seat_types:
                        # 当座位席位是二等座时，且二等座对应infos[9]
                        if seat_type == "O":
                            count = infos[9]
                            # 当count是数字或者是有 时代表有座
                            # 用.isdigtit()方法说明是数字
                            if count.isdigit() or count == '有':
                                is_searched = True
                                break  # 找到一个座位类型就可以退出自己想要的座位类型列表了
                        # 当座位席位是一等座时，且一等座对应infos[8]
                        elif seat_type == "M":
                            count = infos[8]
                            if count.isdigit() or count == '有':
                                is_searched = True
                                break  # 找到一个座位类型就可以退出自己想要的座位类型列表了
                # 当有票即布尔标志为True时执行预定按钮
                if is_searched:
                    self.current_number = number  # 保存下当前选择的车次序号信息
                    # 从train即第一个有数据的tr标签里面用xpath去找预定按钮执行预定
                    order_button = train.find_element_by_xpath('.//a[@class="btn72"]')
                    order_button.click()
                    print(str(number)+"车次有票,当前购买的车次是"+str(number))
                    # 当有票且执行预定了的话，买到票了，就可以退出最外层的对车次解析的循环了
                    return#不能用break只能退出for，return才能退出死循环

            # 当标志为False时,不断执行查询操作
            if is_searched==False:
                try:
                    search_button = self.driver.find_element_by_id('query_ticket')
                    search_button.click()
                    n += 1
                    #trains也要在每次查询点击后再重新查找一下,即更新trains元素
                    trains = self.driver.find_elements_by_xpath('//tbody[@id="queryLeftTable"]/tr[not(@datatran)]')
                    print("第%d次查询中..."%n)
                    #设置等待，让其监控余票
                    #这里可以不设置sleep，或者更慢,自动查询的速度更块
                    sleep(3)

                except StaleElementReferenceException: #俘获异常则pass
                    pass


    def confirm_passengers(self):
        #需要显示等待下，确认下url是否已经变化到确认乘客信息
        WebDriverWait(self.driver,100).until(
            #EC.url_to_be(self.confirm_passenger_url)
            EC.url_contains(self.confirm_passenger_url)
        )
        #需要再显示等待下，确认下乘车人的横栏信息是否加载出来了
        WebDriverWait(self.driver,100).until(
            EC.presence_of_element_located((By.XPATH,'//ul[@id="normal_passenger_id"]/li/label'))
        )
        """确认需要购买的乘客"""
        #需要找到多个li标签下的label，需要elements且返回列表
        passenger_lables = self.driver.find_elements_by_xpath('//ul[@id="normal_passenger_id"]/li/label')
        for passenger_lable in passenger_lables:
            name = passenger_lable.text
            #判断这个获取的name在不在所要买票的人的列表里
            if name in self.passengers:  #注意是列表形式的数据才能用in
                passenger_lable.click() #勾选起来即可

        """确认需要购买的座位类型"""
        #先用Select()包装下
        seat_select = Select(self.driver.find_element_by_id('seatType_1'))
        #下面选择席位，需要根据用户能够接受的席位来选择
        #这步的话有个细节，前面需要保存下之前预定按钮选择的车次序号，以便根据序号来看看对应用户需要的座位类型
        seat_types = self.trains[self.current_number]  # 使用相应的key值查找对应车次序号的座位类型列表
        for seat_type in seat_types:
            #注意细节，假如第一个选择的席位没有票了，选择不到，会抛出异常
            try:
                self.current_seat = seat_type #保存一下当前选泽的席位信息
                seat_select.select_by_value(seat_type)
            except NoSuchElementException:
                continue
            else:
                break  #假如第一个有票就直接选择然后退出循环

        #等待提交按钮可以被点击
        WebDriverWait(self.driver,100).until(
            #即等待某个元素可以被点击
            EC.element_to_be_clickable((By.ID,'submitOrder_id'))
        )
        sumit_button = self.driver.find_element_by_id('submitOrder_id')
        sumit_button.click()

        #判断模态对话框即购票信息对话框出现并确认按钮可以点击了
        WebDriverWait(self.driver,100).until(
            EC.presence_of_element_located((By.CLASS_NAME,'dhtmlx_window_active'))
        )
        WebDriverWait(self.driver,100).until(
            EC.element_to_be_clickable((By.ID,'qr_submit_id'))
        )
        sumit_button = self.driver.find_element_by_id('qr_submit_id')
        #注意这里的细节，由于Seenium自身的Bug，可能会导致确认点击操作无法正确执行
        #故需俘获异常，且需加入无限循环操作，点击之后再获取再点击
        try:
            while sumit_button:
                try:
                    sumit_button.click()
                    sumit_button = self.driver.find_element_by_id('qr_submit_id')
                except (ElementNotVisibleException,ElementNotInteractableException): #当在此页面见不到此元素，代表已进入付款页面
                    break
            print("恭喜鲁！%s车次%s席位抢票成功"%(self.current_number,self.current_seat))
        except:
            pass

    def send_mail(self):
        """发送邮件"""
        # 连接服务器，提供用户名,授权码,服务器地址
        #这里需要您的QQ邮箱开启smtp服务才行。
        yag_server = yagmail.SMTP(user='你的qq邮箱账号', password='你的smtp授权码', host='smtp.qq.com'
        # 填写发送对象，邮件主题和内容
        email_to = ['你的接收通知信息的邮箱账号', ]
        email_title = "恭喜你！%s的%s车次二等座购票成功"%(self.passengers,self.current_number)
        #由于self.passengers是列表的形式,要转为str进行拼接然后加[0]提取内容
        email_content = "乘车人:"+str(self.passengers[0])+"\n"+"出发日期:"+str(self.train_date)+"\n"+"所买车次:"+str(self.current_number)+"\n"+"所买路线:"+str(self.from_station)+"------>>"+str(self.to_station)
          
        # 发送邮件
        yag_server.send(email_to, email_title, email_content)
        print('已发送邮件！')
        # 关闭服务
        yag_server.close()


    """写个run方法,将步骤封装在一起,让使用起来更方便，即不用理里面的细节"""
    def run(self):
        #先登陆
        self.login()
        #查车次余票
        self.search_left_tickets()
        #确认乘客和车次信息
        self.confirm_passengers()
        #购票后发送邮件通知
        self.send_mail()

#引入线程,target是main函数,防止GUI堵塞
def run():
    t = threading.Thread(target=main)
    t.start() #启动线程
    
#输出信息函数
def printlog():
    #提取输入的数据
    name = entry1_str.get()
    date = entry2_str.get() 
    start_station = entry3_str.get()
    stop_station = entry4_str.get()
    train_s = entry5_str.get()
    #打印个人信息
    info='乘车人:'+name+"\n"+"出发日期:"+date+"\n"+"路线:"+start_station+"---->>"+stop_station+"\n"+"所选车次:"+train_s
    text.insert(END,info)

#运行函数
def main():
    #由12306座位类型的代号设置如下
    #9：商务座 M：一等座 O：二等座 3：硬卧 4：软卧 1：硬座      注意:G6006车次7点27出发，9点16到是【复兴号】
    #初始化chromedriver
    driver = webdriver.Chrome(executable_path='chromedriver.exe')
    name = entry1_str.get()
    date = entry2_str.get() 
    start_station = entry3_str.get()
    stop_station = entry4_str.get()
    train_s = entry5_str.get()
    train_infos = train_s.split(' ')#以空格符为分界形成车次信息列表
    trains = {} #创建空字典存储车次信息
    for train_info in train_infos:
        trains[train_info] = ["O"]  #默认都选为O二等座,然后加入空字典
    spider = TrainSpider(start_station,stop_station,date,trains,[name,],driver)
    spider.run()

#输出所填的信息确认
bt2 = Button(root,text = '输出购票信息',font=('Arial', 14),command=printlog)
bt2.place(x= 20,y= 307)
#按钮事件执行时间过长,引入线程,
bt2 = Button(root,text = '确认无误,开始刷票',font=('Arial', 14),command=run)
bt2.place(x= 200,y= 307)

root.mainloop() #加载GUI界面输入信息后再执行购票程序

#if __name__ == '__main__':
    #main()
其中有一个stations.csv文件需要通过爬虫从12306爬取下来,获得其车站和其对应的编码。由于这里上传不了文件，就只给出GUI脚本制作的代码。
GUI界面

后记

近期有很多朋友通过私信咨询有关Python学习问题。为便于交流，点击蓝色自己加入讨论解答资源基地
码农公寓

分享记录一个带有GUI界面的12306(默认二等座)无限自动查询并购票的脚本(购票成功发送邮件)

GUI界面

后记