
Python爬虫知识
文章平均质量分 70
各类爬虫技术:js逆向、scrapy、自动化、代理池等
云辰星.
热爱技术,热爱分享
展开
-
Playwright 解决京东滑块:自动化挑战大揭秘
如何处理JD的滑块登录?(若只想查看京东滑块,请直接滑到最下面)平时所使用的自动化登录工具:Selenium,虽然很好,但是在做京东滑块验证的时候,还是会出现被检测的情况,以至于无法通过校验。于是,我发现了另外一款自动化工具:playwright,也是非常的好用。接下来,就来见证它的强大吧!这就直接copy过来了:Playwright 是一个用于自动化浏览器操作的开源工具,由 Microsoft 开发和维护。原创 2024-12-19 15:37:31 · 1714 阅读 · 0 评论 -
js逆向之AES加密解密封装
ECB:是一种基础的加密方式,密文被分割成分组长度相等的块(不足补齐),然后单独一个个加密,一个个输出组成密文。CBC:是一种循环模式,前一个分组的密文和当前分组的明文异或或操作后再加密,这样做的目的是增强破解难度。解密其实是差不多的逻辑,将base64解码为字节流,然后通过key和iv进行解密,这里不在赘述。因为这里采用的是128位秘钥,也就是16字节,所以你的加密内容也应该是16的倍数。加密,其中有些网站的数据加密就是通过AES这种加密形式来做的。AES是一种对称加密(加密和解密用的。原创 2024-10-17 21:50:33 · 738 阅读 · 0 评论 -
Python调用外部js脚本后的结果乱码问题解决方案
python中调用外部脚本出现乱码问题原创 2024-10-15 11:01:41 · 385 阅读 · 0 评论 -
不会JS逆向也能高效结合Scrapy与Selenium实现爬虫抓取
其实想要实现scrapy和selenium共同完成爬虫任务还是比较简单的。最重要的是理解中间件的性质,并且能够在合适的地方去修改请求/响应内容。在遇到比较复杂的页面时,可以尝试使用scrapy + selenium的模式进行爬取。将两者结合使用,能够弥补彼此的不足,发挥出更大的优势。原创 2024-09-19 18:04:15 · 1155 阅读 · 0 评论 -
Selenium如何通过js注入避免被检测
在使用Selenium进行模拟爬虫的时候,很多时候网站都会有一定的检测机制,能够检测出你这个是Selenium程序,比如淘宝网。原创 2024-09-14 12:54:00 · 676 阅读 · 0 评论