
Python爬虫进阶
文章平均质量分 65
向阳-Y.
大学时的笔记,慢慢不再更新。
展开
-
Python常用函数+定位技巧总结
定位技巧篇etree定位:from lxml import etreetree = etree.HTML(response)public_key = tree.xpath('//input[@id="e"]/@value')[0]遇到字典数据格式可以转成json,并一层层剥离进行定位:import jsondo=json.loads(raw_json)#转换为json数据data_list=do['data']['response']['videos']re,正则表达式定位:impo原创 2021-12-09 17:37:12 · 1402 阅读 · 0 评论 -
Python实战|js逆向空中网
空中网链接:https://passport.kongzhong.com/js代码调试阶段1.查找关键字password,找了半天,只找到了一个被混淆后的js代码2.开启浏览器自带反混淆功能3.Setting——Preferences——Sources勾选上下图框中内容即可4.再次重新搜索一下,VM中就是反混淆后的内容5.进来就能看见相关加密函数,此处打上断点并重新点登录按钮,进入该函数内部6.经过调试发现,该文件内部包含了所有加密所需要的代码7.将里面的代码复制出来进行调试原创 2021-12-08 22:51:57 · 1166 阅读 · 0 评论 -
Python实战|js逆向完美世界
逆向完美世界登录js代码调试阶段1.查看密码关键字段2.Ctrl+shift+f全局搜索:password,找到相关js文件3.从代码的setpublickey、encrypt关键字可以看出,使用了非对称加密算法4.此处打断点,再次运行,进入函数构造内部5.经过分析可知,该文件内所有代码都涉及到非对称加解密,所以直接全部copy出来进行调试6.下图报错,navigator和window未定义,解决方法:因为这两个都是内置函数,所以只需要在代码最前面加上navigator=this;w原创 2021-12-06 19:49:13 · 1795 阅读 · 0 评论 -
Python实战|js逆向凡科网
凡科网地址:https://i.fkw.com/js代码调试阶段凡科网搜搜pwd = 快速定位到记录根据分析,只有这行代码有点可疑,进入该函数实现内部进来之后,发现这个函数在一个闭包里面(小技巧,只需要将闭包中所有的代码全复制出来调试即可)将代码全复制到调试工具中,调试成功爬虫代码编写fanke.pyimport requestsimport execjs#实例化一个node对象node=execjs.get()#js源文件编译ctx=node.compile(open(原创 2021-12-06 11:51:51 · 1357 阅读 · 1 评论 -
Python实战|js逆向steam社区
代码调试阶段:steam社区:https://store.steampowered.com/总体思路:登录抓包,分析包(全局搜索password = ,局部搜索password,在可疑的地方打上断点,并再次登录)1.首先我在代码391行处找到了关键字encryptedPassword,并且后面的值为RSA.encrypt,不难看出这是一个RSA加密,所以此处打上断点。2.再次点击登录,断点停在了这里,接着开始构建函数的实现:定义一个getPwd函数function getPwd(passwor原创 2021-12-05 16:53:55 · 1238 阅读 · 0 评论 -
python实现手机号获取短信验证码 | 对接打码平台
前言本篇文章主要讲了如何利用python自动注册网站(自动识别验证码)ID在用户中心最下面的软件ID里获取识别类型在“价格体系”中查看首先需要花1块钱到超级鹰打码平台上买点题分(1块钱1000提分,可以打100次)超级鹰官网http://www.chaojiying.com主要文件.pyimport timeimport requestsfrom chaojiying import Chaojiying_Client #调用chaojiying.py文件中的函数"""如果请求的网原创 2021-11-24 15:59:19 · 6763 阅读 · 0 评论 -
Python实战|js逆向微信公众平台
substr(0,16)截取字符串,从0开始,长度为16测试微信公众平台登录后抓包,发现pwd密码处被加密猜测pwd,ctrl+shift+f进行全局搜索pwd,由于加密一般是由js实现,所以排除css,试探进入图中代码页进行代码分析点击{},格式化显示代码进入后使用ctrl+f进行局部搜索pwd,加入断点(可疑处全都加断点),然后再点一次"登录"...原创 2021-10-23 23:58:49 · 1055 阅读 · 2 评论 -
Python爬虫js进阶基础|常见的加密算法|md5、对称加密、非对称加密、base64、https、ca证书
目录常见的加密算法Md5DES/AES对称加密AES和DES的区别RSA加密(非对称加密算法)base64伪加密https加密常见的加密算法Md5线性散列算法,可以产出一个128位(16字节)的散列值,且MD5加密后产生的是一个固定长度(32位或者16位)可知,当在逆向时,看到32位或者16位时可以猜测是用的MD5加密算法DES/AES对称加密AES和DES的区别DES全称Data Encryption Standard,即数据加密标准,是一种使用秘钥加密的算法,是一种对称加密算法1.加密后密原创 2021-10-22 21:21:39 · 780 阅读 · 0 评论