分享记录一个带有GUI界面的12306(默认二等座)无限自动查询并购票的脚本(购票成功发送邮件)
from tkinter import * #编写GUI界面
import threading #引入线程,解决GUI堵塞
from selenium import webdriver
#导入显式等待相关库
from selenium.webdriver.support.ui import WebDriverWait
#导入显式等待条件语句库
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By #后面的until()必须元组形式,所以导入By
#导入csv模块来读取站点代号
import csv
#导入表单下滑选项操作的库
from selenium.webdriver.support.ui import Select
#导入可能出现的异常
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import ElementNotVisibleException
from selenium.common.exceptions import StaleElementReferenceException
from selenium.common.exceptions import ElementNotInteractableException
#导入时间模块进行等待
from time import sleep
#导入发送邮件模块
import yagmail
"""将driver放在外面的原因是:
如果放在里面,那么driver将会随着对象的销毁而销毁
而我们的类TrainSpider的实例对象是放在main()函数中执行的
只要main()函数运行完成后,里面所有的变量都会被销毁
也就说spider类实例对象也会被销毁
"""
#初始化GUI界面
root = Tk()
root.title('Carson的12306购票器')
root.geometry('400x350')
#初始化基本GUI界面的组件
lb1 = Label(root,text = '欢迎使用Carson的12306二等座购票器',font=('Arial', 14))
lb1.place(relx = 0.08,rely=0.02)
lb2 = Label(root,text = '乘车人员:',font=('Arial', 12))
lb2.place(x = 45,y = 45)
lb3 = Label(root,text = '出发日期:',font=('Arial', 12))
lb3.place(x = 45,y = 78)
lb4 = Label(root,text = '出发车站:',font=('Arial', 12))
lb4.place(x = 45,y = 111)
lb5 = Label(root,text = '终点车站:',font=('Arial', 12))
lb5.place(x = 45,y = 144)
lb6 = Label(root,text = '购买车次:',font=('Arial', 12))
lb6.place(x = 45,y = 177)
lb7 = Label(root,text = '购票信息如下:',font=('Arial', 12))
lb7.place(x = 0,y = 205)
text = Text(root,height = 5,width=56)
text.place(x = 0,y= 232)
entry1_str = StringVar()
entry1_str.set('输入乘车人的姓名,如:张三')
entry1 = Entry(root,textvariable = entry1_str,)
entry1.place(x = 120,y = 46,height=28,width=160)
entry2_str = StringVar()
entry2_str.set('输入出发日期,格式如:2021-01-16')
entry2 = Entry(root,textvariable = entry2_str,)
entry2.place(x = 120,y = 79,height=28,width=190)
entry3_str = StringVar()
entry3_str.set('输入起始站,如:深圳北')
entry3 = Entry(root,textvariable = entry3_str)
entry3.place(x = 120,y = 112,height=28,width=160)
entry4_str = StringVar()
entry4_str.set('输入终点站,如:潮阳')
entry4 = Entry(root,textvariable = entry4_str)
entry4.place(x = 120,y = 145,height=28,width=160)
entry5_str = StringVar()
entry5_str.set('输入车次,格式如:G6006 D1234')
entry5 = Entry(root,textvariable = entry5_str)
entry5.place(x = 120,y = 178,height=28,width=180)
class TrainSpider:
#将属性放类里面定义为类属性
login_url = 'https://kyfw.12306.cn/otn/resources/login.html' #二维码登陆界面url
personal_url = 'https://kyfw.12306.cn/otn/view/index.html' #登陆后进入的个人中心url
left_ticket_url = 'https://kyfw.12306.cn/otn/leftTicket/init?linktypeid=dc' #查询车次和余票的url
confirm_passenger_url = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc' #确认乘客信息的url
def __init__(self,from_station,to_station,train_date,trains,passengers,driver):
"""
:param from_station: 起始车站
:param to_station: 目的地车站
:param train_date: 出发日期
:param trains: 需要购买的车次。需要字典形式,形式如:{“G529”:["O","M"],"G403":["O","M"]}多车次就多个键值对
:param passengers: 需要买票的乘车人,需要为一个列表
"""
self.driver = driver
self.from_station = from_station
self.to_station = to_station
self.train_date = train_date
self.trains = trains
self.passengers = passengers
self.current_number = None #定义一下变量保存下当前预定的车次序号信息
self.current_seat = None #定义一下变量保存下当前选中的车次的选中的席位信息
#为了方便根据站名文字来取得车站代号,需要创建字典存储代号数据
#且空集合的创建要在函数外,不然执行完函数集合数据就没有了
self.station_codes = {}
#初始化站点代号数据
self.get_station_codes()
#获取车站代码
#这里需要本地有一个station.csv的车站对应代码的文件
def get_station_codes(self):
#读取数据并存放到空字典中
with open('stations.csv', 'r', encoding='utf-8') as fp:
reader = csv.DictReader(fp)
for line in reader:
name = line['name']
code = line['code']
self.station_codes[name] = code
#实现登陆功能
def login(self):
self.driver.maximize_window() #最大化窗口
# 将属性放类里面定义为类属性,调用时需要加self进行调用
self.driver.get(self.login_url)
# 进行显式等待(有条件)设置100秒,且用来判断是否登陆成功
# 即后面判断条件是url是否变化成个人中心的url
WebDriverWait(self.driver, 100).until(
EC.url_to_be(self.personal_url) # 注意类中变量调用加self
#或者EC.url_contains(self.personal_url)
)
print('登陆成功!')
print('开始刷票!')
#查询车次余票
def search_left_tickets(self):
self.driver.get(self.left_ticket_url)
"""起始站的代号设置"""
from_station_input = self.driver.find_element_by_id('fromStation')
#利用用户输入文字获取起始站的代号
from_station_code = self.station_codes[self.from_station]
#通过js代码修改隐藏标签的value值来达到输入起始站的目的
self.driver.execute_script("arguments[0].value = '%s'"%from_station_code,from_station_input)
"""终点站的代号设置"""
to_station_input = self.driver.find_element_by_id('toStation')
to_station_code = self.station_codes[self.to_station]
self.driver.execute_script("arguments[0].value = '%s'"%to_station_code,to_station_input)
"""日期设置"""
#这里没有前面两个复杂,没有被隐含,理论上标签send_keys即可
#但可能也像前面两个输入框一样被处理过,故输入时间也才用执行js代码的方式
train_date_input = self.driver.find_element_by_xpath('//*[@id="train_date"]') #xpath*表任意
self.driver.execute_script("arguments[0].value = '%s'" % self.train_date, train_date_input)
"""执行查询操作"""
search_button = self.driver.find_element_by_id('query_ticket').click()
print("第1次查询中...")
# 因为点击查询按钮后需等待一下才会返回列车车次数据
# 所以在解析具体的车次信息前需要设置等待,采用显示等待(条件即加载出tbody下的tr标签)
"""注意,在until(EC.presence_of_element_located())中
验证元素是否出现,传入的参数必须都是元组类型的locator,如(By.ID, ‘kw’),
不能传入webelement对象,即driver.find_elemet_by_id()的写法不行会报错
"""
# 设置1000秒显式等待有各个列车信息的tr标签出现(一般开售前5分种即5*60=300秒足够了)
WebDriverWait(self.driver, 1000).until(
# 条件判断是某元素即tr标签是否出现,注意..located()里面是元组类型的locator,必须如下写法
EC.presence_of_element_located((By.XPATH, '//*[@id="queryLeftTable"]/tr'))
)
# 注意有许多车次对应许多的tr标签,注意用elements返回列表
# 且注意对第二个tr标签利用xpath里面的not(@属性名)过滤掉
trains = self.driver.find_elements_by_xpath('//tbody[@id="queryLeftTable"]/tr[not(@datatran)]')
#添加一个布尔标志,用于判断所选车次是否有票再去查询
is_searched = False
n =1
#添加死循环,直到数据符合条件才退出
while True:
for train in trains:
# 利用text打印出标签里面关于车次信息的文本即可
# 由于刚打印出来的数据之间都是换行的,现在将其替换空格放成同一行
# 调用split(),以空格进行分割,分割上面替换后的字符串,会返回列表形式的车次的所有信息
infos = train.text.replace("\n", ' ').split(' ')
# 从返回的车次列表信息中提取出车次序号数据
number = infos[0]
# 判断提取的车次序号数据(number)有没有在用户要的车次字典的里面
# 是的话再判断有无席位的信息再去预定,
if number in self.trains: # 注意self.trains我们已定义是字典,{“G529":["O"."M"]}
seat_types = self.trains[number] # 根据numer的键取得定义字典的座席类型
# 取得的座位类型是列表,需要for循环遍历
for seat_type in seat_types:
# 当座位席位是二等座时,且二等座对应infos[9]
if seat_type == "O":
count = infos[9]
# 当count是数字或者是有 时代表有座
# 用.isdigtit()方法说明是数字
if count.isdigit() or count == '有':
is_searched = True
break # 找到一个座位类型就可以退出自己想要的座位类型列表了
# 当座位席位是一等座时,且一等座对应infos[8]
elif seat_type == "M":
count = infos[8]
if count.isdigit() or count == '有':
is_searched = True
break # 找到一个座位类型就可以退出自己想要的座位类型列表了
# 当有票即布尔标志为True时执行预定按钮
if is_searched:
self.current_number = number # 保存下当前选择的车次序号信息
# 从train即第一个有数据的tr标签里面用xpath去找预定按钮执行预定
order_button = train.find_element_by_xpath('.//a[@class="btn72"]')
order_button.click()
print(str(number)+"车次有票,当前购买的车次是"+str(number))
# 当有票且执行预定了的话,买到票了,就可以退出最外层的对车次解析的循环了
return#不能用break只能退出for,return才能退出死循环
# 当标志为False时,不断执行查询操作
if is_searched==False:
try:
search_button = self.driver.find_element_by_id('query_ticket')
search_button.click()
n += 1
#trains也要在每次查询点击后再重新查找一下,即更新trains元素
trains = self.driver.find_elements_by_xpath('//tbody[@id="queryLeftTable"]/tr[not(@datatran)]')
print("第%d次查询中..."%n)
#设置等待,让其监控余票
#这里可以不设置sleep,或者更慢,自动查询的速度更块
sleep(3)
except StaleElementReferenceException: #俘获异常则pass
pass
def confirm_passengers(self):
#需要显示等待下,确认下url是否已经变化到确认乘客信息
WebDriverWait(self.driver,100).until(
#EC.url_to_be(self.confirm_passenger_url)
EC.url_contains(self.confirm_passenger_url)
)
#需要再显示等待下,确认下乘车人的横栏信息是否加载出来了
WebDriverWait(self.driver,100).until(
EC.presence_of_element_located((By.XPATH,'//ul[@id="normal_passenger_id"]/li/label'))
)
"""确认需要购买的乘客"""
#需要找到多个li标签下的label,需要elements且返回列表
passenger_lables = self.driver.find_elements_by_xpath('//ul[@id="normal_passenger_id"]/li/label')
for passenger_lable in passenger_lables:
name = passenger_lable.text
#判断这个获取的name在不在所要买票的人的列表里
if name in self.passengers: #注意是列表形式的数据才能用in
passenger_lable.click() #勾选起来即可
"""确认需要购买的座位类型"""
#先用Select()包装下
seat_select = Select(self.driver.find_element_by_id('seatType_1'))
#下面选择席位,需要根据用户能够接受的席位来选择
#这步的话有个细节,前面需要保存下之前预定按钮选择的车次序号,以便根据序号来看看对应用户需要的座位类型
seat_types = self.trains[self.current_number] # 使用相应的key值查找对应车次序号的座位类型列表
for seat_type in seat_types:
#注意细节,假如第一个选择的席位没有票了,选择不到,会抛出异常
try:
self.current_seat = seat_type #保存一下当前选泽的席位信息
seat_select.select_by_value(seat_type)
except NoSuchElementException:
continue
else:
break #假如第一个有票就直接选择然后退出循环
#等待提交按钮可以被点击
WebDriverWait(self.driver,100).until(
#即等待某个元素可以被点击
EC.element_to_be_clickable((By.ID,'submitOrder_id'))
)
sumit_button = self.driver.find_element_by_id('submitOrder_id')
sumit_button.click()
#判断模态对话框即购票信息对话框出现并确认按钮可以点击了
WebDriverWait(self.driver,100).until(
EC.presence_of_element_located((By.CLASS_NAME,'dhtmlx_window_active'))
)
WebDriverWait(self.driver,100).until(
EC.element_to_be_clickable((By.ID,'qr_submit_id'))
)
sumit_button = self.driver.find_element_by_id('qr_submit_id')
#注意这里的细节,由于Seenium自身的Bug,可能会导致确认点击操作无法正确执行
#故需俘获异常,且需加入无限循环操作,点击之后再获取再点击
try:
while sumit_button:
try:
sumit_button.click()
sumit_button = self.driver.find_element_by_id('qr_submit_id')
except (ElementNotVisibleException,ElementNotInteractableException): #当在此页面见不到此元素,代表已进入付款页面
break
print("恭喜鲁!%s车次%s席位抢票成功"%(self.current_number,self.current_seat))
except:
pass
def send_mail(self):
"""发送邮件"""
# 连接服务器,提供用户名,授权码,服务器地址
#这里需要您的QQ邮箱开启smtp服务才行。
yag_server = yagmail.SMTP(user='你的qq邮箱账号', password='你的smtp授权码', host='smtp.qq.com'
# 填写发送对象,邮件主题和内容
email_to = ['你的接收通知信息的邮箱账号', ]
email_title = "恭喜你!%s的%s车次二等座购票成功"%(self.passengers,self.current_number)
#由于self.passengers是列表的形式,要转为str进行拼接然后加[0]提取内容
email_content = "乘车人:"+str(self.passengers[0])+"\n"+"出发日期:"+str(self.train_date)+"\n"+"所买车次:"+str(self.current_number)+"\n"+"所买路线:"+str(self.from_station)+"------>>"+str(self.to_station)
# 发送邮件
yag_server.send(email_to, email_title, email_content)
print('已发送邮件!')
# 关闭服务
yag_server.close()
"""写个run方法,将步骤封装在一起,让使用起来更方便,即不用理里面的细节"""
def run(self):
#先登陆
self.login()
#查车次余票
self.search_left_tickets()
#确认乘客和车次信息
self.confirm_passengers()
#购票后发送邮件通知
self.send_mail()
#引入线程,target是main函数,防止GUI堵塞
def run():
t = threading.Thread(target=main)
t.start() #启动线程
#输出信息函数
def printlog():
#提取输入的数据
name = entry1_str.get()
date = entry2_str.get()
start_station = entry3_str.get()
stop_station = entry4_str.get()
train_s = entry5_str.get()
#打印个人信息
info='乘车人:'+name+"\n"+"出发日期:"+date+"\n"+"路线:"+start_station+"---->>"+stop_station+"\n"+"所选车次:"+train_s
text.insert(END,info)
#运行函数
def main():
#由12306座位类型的代号设置如下
#9:商务座 M:一等座 O:二等座 3:硬卧 4:软卧 1:硬座 注意:G6006车次7点27出发,9点16到是【复兴号】
#初始化chromedriver
driver = webdriver.Chrome(executable_path='chromedriver.exe')
name = entry1_str.get()
date = entry2_str.get()
start_station = entry3_str.get()
stop_station = entry4_str.get()
train_s = entry5_str.get()
train_infos = train_s.split(' ')#以空格符为分界形成车次信息列表
trains = {} #创建空字典存储车次信息
for train_info in train_infos:
trains[train_info] = ["O"] #默认都选为O二等座,然后加入空字典
spider = TrainSpider(start_station,stop_station,date,trains,[name,],driver)
spider.run()
#输出所填的信息确认
bt2 = Button(root,text = '输出购票信息',font=('Arial', 14),command=printlog)
bt2.place(x= 20,y= 307)
#按钮事件执行时间过长,引入线程,
bt2 = Button(root,text = '确认无误,开始刷票',font=('Arial', 14),command=run)
bt2.place(x= 200,y= 307)
root.mainloop() #加载GUI界面输入信息后再执行购票程序
#if __name__ == '__main__':
#main()
其中有一个stations.csv文件需要通过爬虫从12306爬取下来,获得其车站和其对应的编码。由于这里上传不了文件,就只给出GUI脚本制作的代码。
GUI界面

后记
近期有很多朋友通过私信咨询有关Python学习问题。为便于交流,点击蓝色自己加入讨论解答资源基地
博客分享了一个带有GUI界面的12306无限自动查询并购票的Python脚本,脚本在购票成功后会发送邮件通知。车站信息需从12306爬取stations.csv文件。文章未提供完整代码,但讨论了脚本的实现思路。
328

被折叠的 条评论
为什么被折叠?



