monkey_slh-优快云博客

本文章中所有内容仅供学习交流，抓包内容、敏感网址、数据接口均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关，若有侵权，请联系我立即删除！使用事件监听器打下断点，然后找到网页中强制退出网页的代码，将代码删除，并使用本地替换后，开发者工具可正常运行。看到这种结构，往上一翻，发现是经典的webpack，接下来就是扣js代码的事了。该网站的反debugger机制会导致强制进入开发者工具后，自动退出该网页。将加载器抠出来，再将关键代码抠出来，然后定义一个调用，缺啥补啥就完事。

2024-08-28 16:48:49 583 1

原创 Scrapy爬取异步加载的数据

当我们爬虫遇到懒加载的数据该怎么办呢，首先我们就会想到用selenium模拟人为滑动不断加载数据，最后再获取数据，但是selenium速度又太慢，那么使用selenium+scrapy就刚好可以解决这个问题，下面是一个使用scrapy抓取懒加载数据的一个小案例，代码和方法的不足，还请各位大牛指点一二！！！本文介绍了Scrapy中间件的使用方法，主要涵盖了下载中间件的详细说明。下载中间件是Scrapy中的一类中间件，用于在请求和响应的处理过程中进行拦截和处理。

2023-07-24 15:26:49 795

原创使用scrapy抓取多页内容

前面已经实现了模拟登陆，以及爬取单页数据和照片并保存，那么如果要爬取多页内容该如何实现呢？完善并使用Item数据类：在items.py中完善要爬取的字段在爬虫文件中先导入Item实力化Item对象后，像字典一样直接使用构造Request对象，并发送请求：导入scrapy.Request类在解析函数中提取url。

2023-07-24 01:22:07 985

原创使用Scrapy抓取图片并保存

我们知道使用requests与selenium下载图片都是非常简单的，那么scrapy是怎么下载图片的呢？1.保存图片需要导入ImagesPipeline类2.需要配置settings.py 开启管道并设置保存路径。

2023-07-24 00:55:41 1867

原创使用Scrapy存储内容

爬取数据通常都要持久化使用，这就需要将爬取的数据进行存储，下面将通过几种方式将数据存储，代码以及方法的不足，请各位大牛指点一二！！！使用之前需要在settings中开启pipeline在setting中键表示位置(即pipeline在项目中的位置可以自定义)，值表示距离引擎的远近，越近数据会越先经过有多个pipeline的时候，process_item的方法必须return item,否则后一个pipeline取到的数据为None值。

2023-07-24 00:33:19 829

原创 Scrapy模拟登陆

很多时候我们需要采集的数据都需要先登录，才能看到我们所需要的数据。最近也是学习了scrapy框架，今天就尝试使用scrapy模拟登陆，代码和方法存在不足，还希望各位大牛指点一二！！！start_urls中的url地址是交给start_request处理的，如有必要，可以重写start_request函数直接携带cookie登陆：cookie只能传递给cookies参数接收scrapy.FormRequest()发送post请求。

2023-07-23 22:25:04 859 1

原创初始Scrapy框架

根据学习的需要，最近也是学习了Scrapy框架，下面记录总结一下我对于Scrapy框架的初认识，若有错误，请各位大牛指点一二！！！文档地址：https://docs.scrapy.org/en/latest/1.Scrapy是一个功能强大的Python开源爬虫框架，主要用于抓取互联网上的数据。2.crapy还提供了基于Twisted框架的异步网络库，可以支持高并发、高速度地进行数据抓取和处理。srapy的安装：pip install scrapy。

2023-07-23 11:46:21 133

原创对速7的豆瓣影评分析

今天又重新看了一遍速7，感触颇深啊，又是想念保罗的一天，正好最近学习了selenium，所以就心血来潮爬了一下豆瓣的影评评分做一下分析。由此次分析可知豆瓣用户发布短评的时间主要集中于晚上，20点至0点尤为突出，但随着夜深，比例也在下降，这主要与豆瓣用户的作息生活相关，同时短评一般在观看完电影后发布，所以用户可能偏向于观影结束回到家之后再进行对影片的评价行为。还可以得知北上广使用豆瓣进行评价的记录更多一些，可能是豆瓣的人文、企业文化受众多为一线城市的民众。

2023-07-10 23:38:32 316 1

m0_56535661的博客

原创 JS逆向实战——最新某东cfe滑块

原创 JS逆向入门案例5——金山词霸翻译

原创 JS逆向实战——某多多anti-content

原创 JS逆向实战——某东m端cfe滑块

原创 JS逆向——极验4保姆级扣代码教程

原创 JS逆向案例—喜马拉雅xm-sign详情页爬取

原创 JS逆向入门案例4——某数据服务平台数据爬取

原创 JS逆向入门案例3——Scrape电影排行榜翻页爬取

原创 JS逆向入门案例2——惠金所登录

原创 JS逆向入门案例1——集思录登录

原创某东h5st_5.1（补环境）

原创维普期刊（瑞数6）分析

原创使用飞书API自动化更新共享表格数据

原创 JS逆向实战——豆瓣登录（某讯滑块）

原创 ali140补环境介绍

原创某药品监督管理局（瑞数6）逆向分析

原创 a_bogus1.19纯算分析（第一部分）

原创 a_bogus1.19纯算分析流程记录

原创微博极验验证登录逆向

原创毒物sign逆向分析，抓取商品列表

原创当当网登录滑块逆向

原创有赞滑块登录逆向分析

原创 JS逆向实战——某土地市场网debugger强制返回+webpack