爬虫实例4(抓取12306网站余票信息)

该博客介绍了如何使用Python抓取12306网站2020-5-5成都东到西安北的车次余票信息。作者详细讲解了面对12306的反爬机制,如何构造Headers来获取数据,并通过数据处理找出所需的具体信息,如二等座余票。虽然实验简单,但对于初学者是很好的实践。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介

本实验主要是抓取2020-5-5成都东到西安北所有车次的信息,12306网站设置了反爬机制,要构造Headers才能获取数据,本文对获取的数据先进行了split()分割,将每趟列车的信息分割出来,然后通过与网站数据的对比找出哪些是我们所需要的信息(比如:二等座余票信息对应的是哪个数据等)。本实验比较简单,非常的初级,github上有非常专业的自动抢票买票的源代码。

# Created by 老刘 on 2020/5/4
#导入相关库
import requests
import json
import time
def getdata():
#headers要添加User-Agent和'Cookie'信息,否则不能获得数据
    headers={
   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值