
爬虫
文章平均质量分 83
全村之希望
高级爬虫工程师,Python开发工程师。专注网站Js逆向分析,安卓app逆向爬虫!
展开
-
茅台抢购脚本详细教程, 另已将茅台抢购做成了一个软件
今天对软件进行了升级,公众号上重新回复茅台获取最新软件!!最新软件解压后如图!以管理员方式运行 main.exe软件最后抢购成功是不会主动付款的,要自己去 APP 支付注意使用茅台软件版抢购的朋友需要自己先去 app 上预约抢购!!!预约完之后,运行软件,输入 2 按回车键!,等待到指定时间开始抢购!!!别再问我为什么没动了!因为还没到抢购时间!!别再问我为什么没动了!因为还没到抢购时间!!别再问我为什么没动了!因为还没到抢购时间!!文章上有详细说明的,就不要再问我了!!看文章就对了,问我也原创 2021-01-04 12:01:26 · 140687 阅读 · 180 评论 -
Python自动抢火车票神器!!
一年一度的抢火车票大战正式拉开序幕…然饿大多数人碰到的是这种情况:当你满心期待摩拳擦掌准备抢票的时候,你会发现一票难求!想回趟家真难!那么作为程序猿的你,当然要用程序猿的方式来抢票!下面介绍几款在 github 上面很火的抢票工具!testerSunshine/12306目前 GitHub 上面最火的抢票软件,基于 Python 编写。支持以下功能:自动打码自动登录准点预售和捡漏智能候补邮件通知server酱通知该项目用到了 Tensorflow、keras、sklearn 等深度原创 2021-01-14 14:22:00 · 2394 阅读 · 2 评论 -
亲测有效!抢茅台脚本火了!Github热搜榜第一名!
抢 ???? 茅台的脚本火了!最近几天 Github 上有个异常火爆的项目,那就是用代码自动抢茅台已经连续霸占 Github 热搜榜好几天了!!大家都知道茅台一瓶难求!为什么?因为中间有巨大的利益差价,各大平台上面一瓶茅台售价 1499 元今年中秋期间很多零售商收购价 2800,甚至更高!还是抢着要…我一个朋友,真的是朋友。今天就用这个脚本抢到了两瓶茅台!2000+ 到手!这个项目操作也很简单,用 Python 写的。只需要在配置里面改两个参数, eid fp 即可在下单页面,控制台原创 2020-12-31 15:49:26 · 29225 阅读 · 71 评论 -
爬虫|如何在scrapy请求异常之后再设置代理IP
我们都知道 scrapy 可以设置代理 IP,但是不知道大家有没有遇到这样一个场景:常规的代理IP设置,会对每个请求都生效,也就是说每个请求都会去使用代理但是有些请求根本不需要代理,我希望当我的请求出现错误或超时的时候再去设置代理IP这样既节省了资源,又缩短了请求的时间,毕竟有些代理质量真的一言难尽那么怎么才能让它请求超时的时候,再使用代理IP进行重新请求呢?很容易就想到下载中间件,DowmloaderMiddleware一个介于request, response中间的钩子,用于修改reques原创 2020-10-30 17:08:41 · 2340 阅读 · 3 评论 -
用Python分析了近几年富豪排行榜,我酸了...
10 月 20 日,胡润研究院发布《2020 胡润百富榜》,也就是富富富豪排行榜杭州的马云毫无悬念的再次摘下中国首富桂冠,深圳的马化腾位列第二榜单被我翻烂了,还是没有找到我的名字,难道是被遗漏了吗??难度我不配有名字吗??太可恶了,毕竟我和马云的财富加起来,在榜单上也是排名第十的!不信我? 请看图不仅 2020 年排行榜上没有在我爬取了从 2015 到 2020 这几年的排行榜后,还是没有找到我的名字!5 年!5 年!你知道我这 5 年是怎么过的吗…对!我的排名一直稳定在 13 亿左右(知原创 2020-10-29 09:52:05 · 1072 阅读 · 0 评论 -
scrapy 出现 [twisted.internet.error.TimeoutError:] 的几种解决方案
在使用 scapy 进行大批量爬取的时候,少数请求链接会出现请求超时,当出现请求超时时,爬虫会自动重试三次。扩展,可以 通过 设置 RETRY_ENABLED = False 来关闭重试机制若超过 180s 且三次后且还是没有得到数据,就会出现 twisted.internet.error.TimeoutError 错误。提供几种解决办法:1、降低同时请求的数量CONCURRENT_REQUESTS = 52、 增加超时时间DOWNLOAD_TIMEOUT = 20003、 增加重试次原创 2020-10-17 14:33:19 · 1850 阅读 · 0 评论 -
Python爬虫偷懒神器 ---- 快速构造请求头!
我们在写爬虫构建请求的时候,不可避免地要添加请求头( headers ),一般来说,我们只要添加 user-agent 就能满足绝大部分需求了但这并不是绝对的,有些请求单单添加一个 user-agent 是不能获取到数据的,在不知道是缺少哪个请求头参数的情况下,我一般会先把所有参数全部添加上,然后再逐个排除。如果是后面这种情况,相信大家都会有这种感觉:手动将浏览器中请求头复制粘贴然后构造成字典...原创 2020-03-22 21:00:56 · 542 阅读 · 0 评论 -
Python爬虫进阶之巧破RSA加密
一某团 PASSWORD 参数网址如下:aHR0cHM6Ly9wYXNzcG9ydC5tZWl0dWFuLmNvbS9hY2NvdW50L3VuaXRpdmVsb2dpbg==下面的抓包的界面:这里有三个参数是需求构造的,password,csrf(这个简单,从html中获取即可),h5Fingerprint。h5Fingerprint 以前的参数名是 token, 这个今天不演示,有兴趣...原创 2020-01-07 22:38:33 · 4007 阅读 · 1 评论 -
JS逆向之电信登录
hello,大家好,我是练习时长两个小时的…啊,不对,搞错片场了。这是我给大伙分享的第四篇 JS 逆向实战的文章前面三篇请猛戳下方,顺便帮忙点个好看吧套路还是那个套路,话不多说,直接开干。分析网站地址就不贴了,首先我们来分析下抓包的数据抓包万幸只有一个加密参数,搜索大法好呀,拿着加密参数全局搜一下,参数值呢就是密码输入框的 id 标签,和上一篇分享的那个 ...原创 2019-07-06 19:06:32 · 876 阅读 · 0 评论 -
爬虫网页解析之css用法及实战爬取中国校花网
前言我们都知道,爬虫获取页面的响应之后,最关键的就是如何从繁杂的网页中把我们需要的数据提取出来,python从网页中提取数据的包很多,常用的解析模块有下面的几个:BeautifulSoup API简单 但解析速度慢,不推荐使用lxml 由C语言编写的xml解析库(libxm2),解析速度快 但是API复杂Scrapy 综合以上两者优势实现了自己的数据提取机制,被称为Selec...原创 2019-04-22 09:12:11 · 1320 阅读 · 1 评论 -
Python爬虫进阶之APP逆向(三)
最近有朋友在做新闻资讯类的 app 爬虫,也许大多数人都会认为,一个新闻资讯 app 不会有什么反爬吧。恰恰相反,当你想爬一条新闻的时候都有请求参数加密,可见现在反爬的严重性。分析国际惯例先抓包,万幸抓包非常顺利,抓包结果如下:抓包结果可以看到请求头里面有加密的参数,下面我们通过反编译来破解这个参数同时用 Python 代码来实现加密,这样我们才能愉快的爬爬爬!反编译破解反编译之...原创 2019-06-01 12:54:29 · 4159 阅读 · 2 评论 -
Python爬虫进阶JS逆向贝贝网登录
hello,大jia好,又到了练手时间了,这是我给大伙分享的第…篇逆向文章。前面的几篇猛戳下面:Python爬虫之JS逆向入门篇JS逆向之新榜登录JS逆向之国航登录据说点好看的人最后变得更好看了!好了,进入正题拉,这个是我们今天要破解的网站:https://m.beibei.com/login/login.html分析Chrome 开发者工具我觉得还是有必要学一下的,毕竟工欲善其事,...原创 2019-09-04 09:27:08 · 613 阅读 · 0 评论 -
Python爬虫进阶之JS逆向新榜登录
分享一个破解JS登录的案例抓包调试网站如下:https://www.newrank.cn/下面是登录的抓包:一个 XHR 请求,下断点。或者搜索请求参数打完断点后,重新发起请求,结果如下:分析此时的断点位置,一般是一个 XMLHttpRequest 的请求操作。所以我们顺着调用栈往回追。找到了密码加密的地方,看代码调用了两次 h 函数。其中第二次调用的的参数是将第一次返回...原创 2019-06-27 09:02:16 · 1686 阅读 · 6 评论 -
Python爬虫进阶之JS逆向国航登录
分享另一个破解JS登录的案例抓包网站如下:http://www.airchina.com.cn/www/jsp/userManager/login.jsp下面是登录的抓包:明显 userName 和 password 这两个参数被加密了。全局搜索参数 userType 或者 upassword。因为一般是根据输入框的 id 标签取值,然后做加密!搜索结果如下:猜测应该是 RSA...原创 2019-07-01 09:19:10 · 952 阅读 · 1 评论 -
爬虫必备技能 xpath 用法和实战
环境配置1.本文使用的python版本是python32.使用到的依赖包如下:requestsscrapy在安装 scrapy 之前需要先安装 Twisted(点击下载) 下载符合自己版本的 Twisted,然后将其放入 python 安装目录中,先使用命令安装 pip install Twisted。安装完之后,scrapy 就很容易安装了,安装命令如下: pip ins...原创 2019-03-11 19:32:45 · 548 阅读 · 1 评论 -
Python爬虫进阶之APP逆向(二)
###写在前面的话今天分享另一个app逆向的实战如果觉得对你有用,还请关注下公众号,后续会有更多的app逆向实战篇,以免错过!话不多说,进入正题,开搞###抓包国际惯例,先抓包分析请求参数,可以看到,手机号码以及密码都是加密的###app反编译使用 jadx 直接打开 apk 文件或者用 AndroidKiller 也可以,最近在研究 app逆向,这个工具用的比较多。其实...原创 2019-04-04 14:14:27 · 2648 阅读 · 1 评论