
python爬虫
「已注销」
这个作者很懒,什么都没留下…
展开
-
app中阿里云滑动验证码和抓取代码解耦的一些尝试
考虑这样一个场景,当你提交订单的时候有一个滑动验证码怎么处理?一般我们会采用自动化浏览器完成这样的抓取,但是如果这样做的话效率太低。这篇文章来尝试将滑动验证码和抓取的代码进行解耦。也就是滑动验证码只管获取获取之后的token,而抓取的代码只管抓取。中间通过相关数据存储介质进行通讯。背景分析阿里云的滑动验证码只是操作行为的验证,并没有与业务的上下文绑定。简而言之,就是阿里云...原创 2020-03-29 02:12:27 · 2636 阅读 · 5 评论 -
frida-某资讯app逆向的过程
本篇文章用来记录我第一次使用frida进行完整逆向的过程。目标是逆向出此app的请求流程。效果反爬点详细流程查壳使用查壳工具 ApkScan-PKID查下目标app的采用了什么加固?脱壳使用 FRIDA-DEXDump 进行脱壳获得dex文件使用jadx打开dex文件,并根据抓包路径(v3/newsFlash)进行搜索。搜索到的是http的接口,我们...原创 2020-03-19 03:00:05 · 2886 阅读 · 2 评论 -
js逆向之js无限debugger的原理探索
采集pc数据的时候,会遇到很多的反爬机制。今天尝试探索下如何在合适的条件下触发js的无限debugger。原创 2020-03-02 00:20:41 · 2469 阅读 · 0 评论 -
赵雷的歌都讲的是什么
赵雷的歌词原创 2019-08-10 23:22:15 · 578 阅读 · 0 评论 -
微信小程序之小红书旅行频道
抓取微信小程序的数据,有时候会给我们带来极大的便利。本篇文章通过抓取小红书数据,演示了微信小程序的抓取流程。原创 2019-05-27 06:03:42 · 2742 阅读 · 1 评论 -
字体反爬之猫眼电影
每个字体的笔画是固定的,通过unicode-->字体笔画,字体笔画-->真实数字,这两个关键关系。我们能够解析出猫眼电影的真实票房原创 2019-04-30 13:30:04 · 518 阅读 · 0 评论 -
微信公众号实时抓取
很多业务可能都会抓取微信公众号。而有些时候由于对方app或者我们技能的限制,导致并不能简单的脱壳处理。今天我们演示如何使用Appium+中间人代理mitmproxy进行微信公众号实时抓取。原创 2019-04-21 22:40:22 · 2349 阅读 · 0 评论 -
js逆向之mytoken热搜榜
币圈的同学应该都听说过MyToken,其中最有价值的就是他的热搜榜。与其每天盯盘炒币,不如写一个脚本抓取它热搜榜数据。原创 2019-04-08 21:45:46 · 1275 阅读 · 1 评论 -
js逆向之携程酒店房价抓取
2019-05-11 修复携程eleven参数改版问题1 在调用require的时候判断是不是参数是不是path,如果是抛出异常2 重新window的构造方法的toString方法,返回[object Window]原创 2019-03-29 19:45:43 · 5290 阅读 · 22 评论 -
puppeteer破解阿里h5滑动验证码
阅读流程前沿效果代码滑动中的两个关键点总结前言说到滑动验证码,大家想到的就是通过无头浏览器,模拟手势滑动。但是这个过程有两个重要的点。突破了这两个点,滑动验证码就可以很轻松的绕过了。shi效果话不多说,直接上代码。 var puppeteer = require('puppeteer') const devices = require('puppeteer/Devic...原创 2019-03-15 00:01:54 · 9636 阅读 · 0 评论