查看流量包,请求参数都是经过加密的,但是字段名比较普通,不能通过搜索字段名去定位
换页后发现只有 s 这个字段的值是保持不变的
全局搜索s的值
全局搜索 __signature
看到加密参数生成的位置了
s如何获取?请求网页内容解析即可
如何过验证?
通过自动化 selenium 技术 截图整个网页并裁剪出验证码图片部分
再通过 ddddocr 识别验证码,并通过 selenium 定位文本输入框自动输入验证码,并点击确定按钮
加载出来后再请求数据接口获取数据
请求参数中的那个 __signature 的值通过javascript获取,因为它直接写在网页中
注意,点击其他页的时候会再次提示输入验证码,不过我们请求数据只需要过一次验证,就是自动化打开网页时候要输入验证码那一块。
结果: