- 博客(10)
- 收藏
- 关注
原创 爬虫逆向之RSA案例--Temu登录密码加密
本文主要是对RSA算法进行了一个详细的分析,并且实际应用在逆向Temu登录中,以实战的方式方便读者理解及学习
2025-02-13 10:40:32
1350
原创 关于execjs带有中文就会报‘gbk‘ codec can‘t decode byte 0xa3 in position 331: illegal multibyte sequence的问题解答
上周开发了一个爬虫程序,但在使用execjs调用的时候报错了'gbk' codec can't decode byte 0xa3 in position 331: illegal multibyte sequence。这个时候检查了JS文件的编码格式正是utf-8,文件编码也选择了utf-8格式了,但依旧报错了。我那会直接懵了。
2024-12-02 14:07:16
234
原创 1688商品爬虫(2024-12-2依旧稳定,必成)
这里小白就采用最朴实的方式,一个一个打断点吧,而老手们看几眼就知道加密位置在哪了(嘿嘿比如我),在这里我们就看见了salt以及sign的加密方式了。点击翻页之后再次发起一个数据接口,我们比较一下这两个接口的区别后发现,参数asyncreq,salt,sign会发生变化。逻辑是这样的,先通过js返回MD5的加密前参数传给d,再把d送到python里进行md5加密,随后就能得出salt和sign的值了。从2中我们已经知道了接口的规则,那么接下来只要的出这些参数就能进行模拟请求了。f:时间戳加上一个随机数。
2024-12-02 13:54:15
1595
原创 打造自己专有的翻译网站!(逆向分析及网页打造)
本次案例主要是对某道翻译进行一次简单的逆向操作,并且分析了其逆向过程。再结合爬虫文件于Flask框架进行简单的整合
2024-06-10 20:49:59
1626
原创 爬虫-uiautomator2获取拼多多APP端商品数据
接下来我们该对商品进行点击,进入到特定的商品详情页后。这里我们采用定位¥这个符号,因此该符号每一个页面都有,并且为了预防会出现重复点击的事件发生,我们讲元素定位到价格,采用定位¥元素的兄弟节点,并且记录兄弟节点的方式,以此达到不会重复点击的目的。这里我们先观察pdd界面,观察它搜索框的位置,可以看到它的定位有text,resourceld的方式,但由于text情况并不稳定,因此我们采用resourceId的定位方式,点击搜索框元素。但点击进入页面之后,为了表现出循环的方式,因此还添加点击返回的操作。
2024-06-01 21:09:05
4173
2
原创 关于Ajax爬虫的方法(全站数据爬取)
AJAX简单来说是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。常见的比如淘宝或者微博滑到底部会出现"点击加载更多",或者滑到底部会自动出现更多的内容。此类网站皆是Ajax网站。
2024-05-05 22:18:38
977
Studio C6031
2022-11-10
TA创建的收藏夹 TA关注的收藏夹
TA关注的人