- 博客(10)
- 收藏
- 关注
原创 人人网登录并写留言板(Requests,js逆向)
一、简介 主要实现人人网登录以及发布留言板信息 requests js逆向二、实现过程 2.1 登录(案例使用账号为18888888888 密码123456 后面成功登录使用的是自己的账号) 登录链接https://www.renren.com/login 先不说多,抓个包放松一下 post请求了http...
2021-08-13 23:41:42
959
3
原创 元气动态壁纸爬虫(入门)
线程import requestsfrom lxml import etreeimport threadingfrom queue import QueuepageUrlQueue = Queue()downloadQueue = Queue()def parsePageUrl(pages): for page in range(1,pages+1): url = "https://bizhi.ijinshan.com/dtag_109/index_"+str(
2021-07-31 14:11:43
3387
1
原创 猿人学12题代码
#12 入门级js(0难度)- 猿人学 (yuanrenxue.com)import base64import requestsdef getM(page): res = base64.b64encode(s = ('yuanrenxue' + str(page)).encode("utf8")) return str(res)[2:-1]def spider(): v = 0 for page in range(1,6): m = getM(
2021-07-29 15:04:57
155
原创 猿人学第一题代码
链接 http://match.yuanrenxue.com/match/1python ----demo1.pyimport execjsimport osimport timeimport requestsdef getTime(): t = int(time.time())*1000+ (16798545 + -72936737 + 156138192) return tdef getM(): t = getTime() f = open("..
2021-07-29 15:03:40
179
原创 百度翻译爬虫
一、简介 小白一枚,如有不足请斧正。 百度翻译和网易有道词典翻译算是入门级的JS逆向爬虫了,站内有很多大佬的文章,我这就简单写写了。二、加密分析 2.1 API分析 不难找到返回结果的包是下面这个它的参数如下多次测试后,我们可以发现这个token是固定写死的,只有这个sign在改变,这个query是查询的字符,并且中文转英文和英文转中文,这个form 和 to 是会变化的。 ...
2021-07-26 14:56:20
1254
原创 网易云音乐评论和歌词爬取
一、简介 小白一枚,如有不足,敬请斧正。 本文内容是关于网易云音乐的评论有和歌词的JS逆向爬虫爬取。二、环境 python3.6.5 nodejs三、 具体内容(分析评论,歌词的步骤一模一样) 3.1 接口分析 从抓包工具之中,我们不难找到评论所在的包,如下图: 其中,getxxx是评论,lyri...
2021-07-26 13:14:12
770
1
原创 python3爬虫登录微博(requests)
一、简介小白一枚,如有不足,请不吝赐教。本文总体架构和站内大佬的的差不太多,登录过程总共分为三个阶段:预登录,登录和最后的跳转登录。不过我查看站内大佬的资源以及github上的资源时发现,时间都是比较久远的了,对于现在的微博反爬技术稍稍有一点不足,比如现在登录需要特殊验证渠道去实现:扫码验证、微博内点击验证以及短信验证。鄙人都实现了,其实原理都差不多,因此我就发了这个相对于而言验证操作比较简单的来作为例子讲解。二、过程分析2.1 预登录 当我...
2021-07-01 00:20:52
3198
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人