pythonselenuim练习

12306网站自动化测试

最新推荐文章于 2021-06-06 04:19:36 发布

原创最新推荐文章于 2021-06-06 04:19:36 发布 · 115 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#selenium #chrome

python爬虫笔记专栏收录该内容

26 篇文章

订阅专栏

本文介绍使用Selenium进行12306网站的自动化登录与查询操作，包括设置显示等待、处理垃圾回收机制及获取站点信息，并将站点信息保存为CSV文件。

12306练习

webdriver.Chome（）要放在全局，放在类当中会触发垃圾回收机制

当登录的时候，为了方便查看，用显示等待，当触发了页面包含（url_contains)，打印登录成功

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC


# 登录
driver = webdriver.Chrome()
class TrainSpider():  # 出发地、目的地、日期
    login_url = 'https://kyfw.12306.cn/otn/resources/login.html'
    personal_url ='https://kyfw.12306.cn/otn/view/index.html'

    def __init__(self, from_station, to_station, train_date):
        self.from_station = from_station
        self.to_station = to_station
        self.train_date = train_date
        # 放在这里会触发垃圾回收机制，即当调用类后，被销毁，而driver在类里面，也会销毁所有放在全局里面
        # self.driver = webdriver.Chrome()

    def login(self):
        driver.get(self.login_url)
        WebDriverWait(driver,100).until(
            EC.url_contains(self.personal_url) #包含个人信息网址
        )
        print('登录成功')

    def run(self):
        self.login()


def main():
    spider = TrainSpider('北京', '上海', '2021-05-11')
    spider.run()


if __name__ == '__main__':
    main()

在这里插入图片描述

余票查询

获取站点信息

在这里插入图片描述

import requests
import re
import csv

url ='https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9028'
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36'
    }
req =requests.get(url=url,headers=headers)
req.encoding ='utf-8'
# print(req.text)
reqt =req.text
## 规律：
# @bjb|北京北|VAP|beijingbei|bjb|
# 0@bjd|北京东|BOP|beijingdong|bjd|
# 1@bji|北京|BJP|beijing|bj|
# 2@bjn|北京南|VNP|beijingnan|bjn|
station =re.findall(r'([\u4e00-\u9fa5]+)\|([A-Z]+)',reqt)
a = dict(station)
# print(a)
# print(station1)
# station =dict(station,indent=4)
# print((station))
lst =[]
for stations,index in enumerate(a):
    dict ={}
    # dict['name'] =
    # print(index,a[index])
    dict['name'] =index
    dict['编码'] =a[index]
    # print(dict)
    lst.append(dict)

# filname =('name','编码')
# pd.DataFrame(station,index=[0]).to_csv('站点信息.csv',encoding='utf-8')
headers =('name','编码')
with open('12306车站编码.csv','w',encoding='utf-8',newline='')as f:
    writer =csv.DictWriter(f,fieldnames=headers)
    writer.writeheader()
    writer.writerows(lst)