人生苦短,我用python,学了段时间爬虫,该应用下了,不如就拿我们学校教务处开刀呗,心疼我教3秒。
废话不多说,首先先分析下教务系统登陆机制:
先打开谷歌浏览器,登陆川农教务处,按F12,记得把preserve log(保留日志)打上勾,后面分析数据要用到
怎么找验证密码的网站呢?提交网站后一般都会重定向(跳转到其他网站),所以找到状态码为302并且请求方式是post的即可
接下来我们分析下需要提交哪些东西。
一般提交的有header,post表单和验证码(此处没有),先说header:
header里面那么多数据,但不全都是必须提交的,多登陆几次你会发现变化的只有cookie,那么cookie怎么获取呢?我们访问教务网主页,服务器返回的信息里就有需要的cookie,具体怎么获取请看代码(前面让勾选保