python爬虫登录正方教务管理系统获取成绩数据

本文介绍了如何使用Python进行网络爬虫,模拟登录四川理工学院的正方教务管理系统,获取成绩数据。首先,程序需要requests库支持,以及正则表达式解析网页。在HTTP通信中,需注意获取登录页面的__VIEWSTATE,并在请求验证码时携带cookies。登录时通过识别登录失败后的网页标题来判断登录状态。在查询成绩时,GET请求需包含学号、姓名和项目代码,并确保headers中包含referer。最后,代码能够处理输入错误并重新尝试登录。

本程序以四川理工学院教务管理系统为例。。。。

准备工作:1.ruquests库的使用(或者urllib也可行)

    2.正则表达式的书写

                    3.HTTP通信基础

                    4.一些解析库的使用



准备一个浏览器监视工具,这里我是用的是fiddler下载地址点击打开链接

登录官网获取到登录系统url:http://61.139.105.138/default2.aspx


这里可以知道浏览器是先请求登录页面,让后转到去获取验证码图片。

仔细分析验证码连接发现:


这个请求方式是get但包含有cookies

所以模拟登录前获取验证码时需要带上cookies否则登录会一直提示验证码错误


查看发送的请求

__VIEWSTATE可以在登录页面的脚本中捕捉到 后面的数据便是post请求需要带上的数据

最后对于网页上的验证码问题,这里选择下载验证码图片并自动打开。

下面贴上模拟登录的代码

import requests
import re
fro
评论 10
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值