最近需要爬取淘宝的某些数据,研究了下,特此记录:
理论上来说,如果代码里模仿浏览器调用接口,所有传入淘宝后台就可以获取资源,但是淘宝的cookie每次请求都在变化(其中isg和l参数是由js生成),所以只有那些不验证isg和l的资源能够使用cookie获取,我猜想淘宝的很多页面资源是验证isg和js参数,所以cookie只能使用一次,这是在按照正常流程浏览器人工登录获取cookie的情况下。
那怎么通过非浏览器去获取cookie呢?一是直接调登录接口获取cookie二是用自动化测试工具获取,但技术不够,如今无法获取。也就是淘宝后台做了cookie验证和其他参数验证。
淘宝cookie中isg和l参数的猜想
最新推荐文章于 2024-08-08 18:47:48 发布