- 博客(3)
- 收藏
- 关注
原创 商智x_req_sign
之所以说结构类似,是因为base64编码之后还是会有比较小的区别,如果用python中自带的MD5,需要把结果中的+和-替换掉。由encrypt_data、secret_key、secret_index多个参数MD5加密后获取。如果直接调用页面中的JS,结果比较过程比较简单,但是要使用nodejs和crypto-js包。crypto-js和python中的MD5是可以互相转换的,例如下面两段代码的效果就是类似的。商智headers中的加密参数,如果不加的话无法得到正确返回。
2024-10-16 11:35:11
792
原创 淘宝商品评论爬取历程整理
多次调用上述任何接口,都会触发x82y滑块,现在滑块主要有三种类型:普通滑块、拉动出现某个画面就停止的滑块、连续按照要求多次点击的滑块,难度依次增加,而且无法用普通的selenium或者playwright搞定。,有一个加密参数ua,亲测可以去掉,但是怀疑去掉之后很容易被风控,而且这个接口没办法过滤”此用户没有填写评价“的评论,会获取大量没意义的评论。店透视插件可以下载所有评论,但是因为需要手动处理,比较麻烦,适合不懂技术的小白。终极问题,对于我们这种没有多账号的,爬的多了总会遇到风控,而且没办法跳过去。
2024-10-14 15:44:23
2077
原创 云图shorcode逆向
发现变化的规律是,会随着时间和建包类型变化,同一时间的同类建包,即使code不同,shortcode也一样。云图建包中,每个月shortcode都会变,于是找时间逆向了一下。难度主要在于异步和代码混淆,最终是个比较典型的AES加密。
2024-10-14 11:36:39
408
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅