1.cookie及cookie反爬简单介绍
cookie简单来就就是我们在某个网站唯一的用户标识,就是一数据包
cookie反爬则是指服务器通过校验请求头中的参数值来区分正常用户和爬虫程序的手段。
这种服务器返回cookie的解决办法就是:浏览器先向服务器发送请求,服务器在响应头上带上cookie,我们下次发送请求的时候带上cookie就行
2.话不多说,直接上案例
目标站点:互动交流 - 麻章区政府网站
数据接口:http://www.zjmazhang.gov.cn/hdjlpt/letter/pubList
1.观察接口请求参数
就cookie参数和x-csrf-token两个加密参数
2.分析参数
x-csrf-token参数:常为第一次响应数据里的常数, 我们检索一下发现在第一次请求接口里正好找到了。所以我们在请求这接口后获取该参数并在下次请求数据接口时带上就行。
cookie参数:我们之前说过这是服务器返回cookie类型,我们到第一次请求接口(全部里的第一个)产看响应参数,发现这返回的cookie正好与我们之前请求参数里的cookie值一样。
3.发起请求获取cookie和x-csrf-token
第一次请求正常请求就行
x-csrf-token 通过正则匹配获取
cookie 通过response.cookies.get()获取
4.携带参数请求 目标数据接口
效果图如下
以上就是服务器返回cookie类型的解决办法
代码用途
本代码仅供学习、研究和交流使用,禁止用于任何商业用途或非法用途。使用者应对其行为负责,作者不对代码的滥用或不当使用承担任何责任。