
爬虫相关学习
文章平均质量分 74
爬虫技术分享
十一姐
这个作者很懒,什么都没留下…
展开
-
akamai3.0反爬教程逆向分析9个视频汇总
目录一、akamai2.0文章二、akamai3.0每月疑似改版点二、9个视频汇总如下一、akamai2.0文章文章1cookie反爬之akamai_2.0-上文章2cookie反爬之akamai_2.0-上文章3cookie反爬之akamai_2.0-上文章中akamai2.0对应调试html与js文件二、akamai3.0每月疑似改版点详细文字与2.0算法函数几乎一致,不再写重复文章点击文章查看3.0疑似改版点视频中akamai3.0对应调试html与js文件二、9个视频汇总原创 2025-01-02 21:45:00 · 2898 阅读 · 0 评论 -
Scrapy请求失败但requests请求成功的小经验fiddler抓包对比
Scrapy请求失败但requests请求成功的小经验fiddler抓包对比原创 2024-12-31 20:45:00 · 612 阅读 · 0 评论 -
linux/centos安装最新版本chrome解决 libc.so.6(GLIBC_2.25)(64bit) /You could try using --skip-broken to work a
【代码】linux/centos安装最新版本chrome解决 libc.so.6(GLIBC_2.25)(64bit) /You could try using --skip-broken to work a。原创 2024-07-17 18:45:00 · 8725 阅读 · 9 评论 -
ReferenceError: require is not defined in ES module scope, you can use import instead
【代码】ReferenceError: require is not defined in ES module scope, you can use import instead。原创 2024-03-17 13:38:47 · 2794 阅读 · 1 评论 -
Warning: To load an ES module, set “type“: “module“ in the package.json or use the .mjs extension.
【代码】Warning: To load an ES module, set “type“: “module“ in the package.json or use the .mjs extension.原创 2024-03-17 13:35:09 · 3712 阅读 · 1 评论 -
ModuleNotFoundError: No module named ‘torchvision.models.utils‘
【代码】ModuleNotFoundError: No module named 'torchvision.models.utils'原创 2023-11-07 23:25:23 · 898 阅读 · 0 评论 -
kafka消费/发送消息,消息过大报错解决whose size is larger than the fetch size 1048576
就是我们自己写python消费kafka代码的时候没有参数配置没有限制。问题原因一:是kafka本身的配置没有调整到上限。原创 2023-09-20 12:13:17 · 2234 阅读 · 0 评论 -
python3.11版本pip install ddddocr调用时报错got an unexpected keyword argument ‘det‘ 解决
最新python环境安装ddddocr调用报错解决原创 2023-09-19 22:21:15 · 2586 阅读 · 1 评论 -
通过curl命令分析http接口请求各阶段的耗时等
curl命令的使用原创 2023-09-09 10:12:19 · 3817 阅读 · 0 评论 -
谷歌浏览器响应Failed to load response data: no resource with given identifer found
谷歌浏览器响应Failed to load response data的另类解决方案原创 2023-08-26 09:28:14 · 4777 阅读 · 1 评论 -
浏览器开发者工具平台js代码开启展开收起
浏览器js文件的展开和收起设置原创 2023-08-26 09:16:17 · 791 阅读 · 0 评论 -
PyCharm关闭重复代码检查高亮显示以及最大行长度限制修改
pycharm高亮显示修改原创 2023-08-21 07:01:40 · 3516 阅读 · 0 评论 -
解决Pycharm的Settings中Project不见了也无法选择Python Interpreter的方法
pycharm突然无法配置python项目解释器,idea文件夹删掉原创 2023-08-19 10:28:37 · 4574 阅读 · 3 评论 -
使用开源项目并使用docker的方式搭建代理接口
使用docker-compose的方式搭建代理池子接口原创 2023-07-19 22:45:33 · 2107 阅读 · 5 评论 -
b站视频播放三倍速
b站视频播放三倍速原创 2023-07-16 08:44:05 · 738 阅读 · 0 评论 -
交流群问题-收集记录
一个问题的收集窗口,会持续修改更新这篇文章原创 2023-07-08 08:02:32 · 714 阅读 · 0 评论 -
nodejs-pm2管理js并发/自动重启/恢复等
我们用pm2 delete模拟了进程挂断的场景,比如express_api进程没有了,然后恢复下,直接敲。我们平常运行js可能就node aaa.js就结束了,其实用pm2管理更好,,也可以启动管理python文件。批量删除/停掉/重启。原创 2023-07-04 21:27:21 · 3920 阅读 · 0 评论 -
爬虫小白入门在服务器上-部署爬虫或者开服务接口并供给他人访问
这个介绍了下如何在服务器上部署爬虫,已经把js服务部署成服务接口的操作方式,以及如何开自己的服务器原创 2023-07-02 20:12:11 · 4576 阅读 · 0 评论 -
pycharm设置新建文件自动生成脚本模板
pycharm新建文件自动生成脚本模板原创 2023-07-01 08:57:52 · 1081 阅读 · 0 评论 -
爬虫工具-替换js文件ReRes插件/Gores插件
爬虫逆向过程中,替换修改网站js文件来过掉无限Debugger,或者想hook某个cookie添加hook的js文件替换; 或者想把某个混淆的js文件替换成还原后的js文件都可以原创 2023-06-28 22:30:34 · 7194 阅读 · 2 评论 -
工具-自动获取/校对XpathHelper/XpathHelperPlus/XPathHelperWizard插件轻松配置xpath规则
工具-自动获取/校对XpathHelper/XpathHelperPlus/XPathHelperWizard插件轻松配置xpath规则,数据采集辅助路上的好助手原创 2023-06-15 21:40:52 · 6513 阅读 · 6 评论 -
k8s安装
Kubernetes集群分为一个master主节点和worker工作节点。可直接通过官网已经搭建好的测试,不用进行下面的安装。,打开PowerShell执行如下命令。原创 2023-02-20 20:53:14 · 1907 阅读 · 1 评论 -
工具-自动获取/校对xpath helper
xpath helper插件可自动根据鼠标点击区域获取xpath,也能实时核对返回的xpath结果原创 2023-02-06 21:10:08 · 6969 阅读 · 3 评论 -
Docker桌面版安装与使用(windows)
docker2、删除镜像:,删除镜像的前提是没有使用这个镜像的容器,原创 2022-12-05 20:37:58 · 19060 阅读 · 2 评论 -
switchyomega插件实现浏览器自动一分钟切换代理
实现1分钟自动切换。原创 2022-08-05 07:10:31 · 16462 阅读 · 3 评论 -
windows下Redis-cluster集群搭建
1、Redis-x64-5.0.14.1.zip 下载, 6 台 redis 服务器,搭建伪集群,并运行在不同的端口 6380-6385原创 2022-06-30 00:12:08 · 1717 阅读 · 1 评论 -
Python之Kafka安装与使用
目录一、kafka基础概念了解二、下载安装Kafka三、KafkaTool可视化工具四、python操作kafka1、生产者代码2、消费者代码一、kafka基础概念了解Kafka是一种高吞吐量、持久性、分布式的发布订阅的消息队列系统kafka文档为什么应该学习 KafkaKafka 里面的信息是如何被消费的?使用生成器把Kafka写入速度提高1000倍Kafka名词概念producer:消息生产者,向 Kafka Broker 发消息的客户端broker: 一台 Kafka 机器就是一个原创 2022-05-14 23:42:57 · 9572 阅读 · 1 评论 -
Python之Elasticsearch8.2.0
目录一、Elasticsearch1、概念名词了解2、Elasticsearch安装3、ik分词插件安装4、kibana可视化安装5、Windows配置ElasticSearch服务二、python操作Elasticsearch1、创建索引2、删除索引3、新增数据4、更新数据5、删除数据6、查询数据一、Elasticsearch1、概念名词了解非常强大的搜索引擎,便于存储和检索,可以快速存储、搜索和分析海量数据,维基百科/Stack Overflow/GitHub都采用其实现一个分布式的实时文档存原创 2022-05-14 15:09:49 · 3291 阅读 · 8 评论 -
利用打码平台识别点选验证码
一、打码平台-超级鹰使用流程首先注册用户 ,然后登录到用户中心,生成一个软件ID根据自己的代码,下载接口调用代码demo,这里是python对于普通的字符验证码,我们可以用ddddocr/muggle_ocr识别即可对于点选验证码,先到这里根据实际情况确定验证码类型,一般点选我们选择如图中的最终代码调用结构大概如下, post_pic用于传验证码字节流,和验证码类型,然后获得识别结果;resport_error传图片id上报错误的图片识别,不扣分二、点选验证码注意事项需要在底部原创 2022-05-02 11:37:36 · 4843 阅读 · 1 评论 -
Python生成GMT时间格式以及时间戳日期等
目录一、datetime生成GMT时间格式二、python将时间戳与日期格式化互相转换三、python生成一定范围的日期集合四、python生成一定今天/昨天/明天的日期五、python将excel的日期数字42380格式化六、python比较两个日期大小一、datetime生成GMT时间格式案例: js当中生成的格式如下new Date()+Math.random(1000)即'Sat Apr 30 2022 15:03:40 GMT+0800 (中国标准时间)0.2551832336696775原创 2022-04-30 15:47:34 · 7145 阅读 · 1 评论 -
Python调用js的方式
execjs/nodevm2/Minracer/node原创 2022-03-22 21:24:34 · 3759 阅读 · 4 评论 -
JS解混淆-AST还原案例
目录一、js混淆了解1、为什么要混淆?2、常见的混淆模样二、AST初步认识三、解混淆常用的方法一、js混淆了解1、为什么要混淆?js混淆的作用:为了防止爬虫通过分析js内容,轻易的还原出网站的加密逻辑,而做出的安全防御手段之一,常常将一个逻辑简单的可能十几行算法代码思路,通过变量混淆替换、增加冗余无效代码、增加无限debugger反调试功能、增加多层的套娃式if~else代码、以及埋陷阱等混淆成几千行的js代码,给人第一印象难读,对入门分析者造成恐惧心理如图,我们常见的ob混淆就是这个原理,左侧也原创 2022-03-12 14:21:07 · 18890 阅读 · 2 评论 -
深度学习-Yolov5入门到实战点选数据集训练
yolov5是主要的作用:给定一个已经标好的数据集》跑yolov5代码得到一个目标检测模型》选择一个图片或者视频等再给yolov5代码,yolov5代码就能自动识别区分出目标体原创 2022-02-12 23:34:30 · 4902 阅读 · 0 评论 -
深度学习-Pytorch环境安装
目录一、pytorch环境安装(windows)二、训练步骤一、pytorch环境安装(windows)1、下载Anaconda:Anaconda3-2021.11-Windows-x86.exe ,然后安装设置安装路径"D:\Programmer\Anaconda3",然后手动添加环境变量2、查看自己电脑上显卡信息:打开cmd窗口输入nvidia-smi显示GPU当前的状态,可以看到本机cuda版本是11.2 , 查看cuda与显卡驱动的映射表3、复制安装pytorch的命令:原创 2022-01-29 10:59:57 · 3618 阅读 · 2 评论 -
自动化测试工具-Airtest
目录一、Airtest介绍与安装二、Airtest基于图像识别自动控制手机App流程三、Airtest基于Poco的UI组件自动化控制App流程一、Airtest介绍与安装主要介绍区别可以看这篇文章,和selenium、appium都是用来自动化测试的不管是appium、airtest,都有录制功能然后自动化生成代码,所以我们可以通过先录制的操作生成代码,然后改代码就可以学会一些常用的功能操作了它的明显特征是基于图像识别来自动控制手机App流程它也可以是基于Poco的UI组件自动化控制App流程原创 2022-01-19 11:15:15 · 22032 阅读 · 2 评论 -
汉字目标点选识别-ddddocr
目录一、ddddocr介绍二、识别效果三、代码一、ddddocr介绍ddddocr 新的目标检测识别 1.3功能安装 pip install ddddocrstar哲哥免费开源的识别项目https://github.com/sml2h3/ddddocr二、识别效果三、代码图片demo代码 ,更多详细介绍看ddddocr 新的目标检测识别 1.3功能"""@author:十一姐@desc: ddddocr目标识别@time: 2022/01/09"""from i原创 2022-01-09 10:12:13 · 20495 阅读 · 10 评论 -
vscode运行go安装与代码乱码解决
一、Go环境安装及简单了解windows点击下载go,以及环境变量设置,然后cmd输入go如下图显示则代表安装成功编辑hello.go文件, vscode直接运行即可输出package mainimport "fmt"func main() { fmt.Println("Hello, World!")}二、vscode运行go代码乱码解决方案:点击Run>Add Configuration>settings.json,在该文件下添加如下两行代码,然后保存原创 2022-01-05 22:05:47 · 2219 阅读 · 6 评论 -
js逆向知识-Ja3指纹学习
一、ja3指纹介绍1、指纹:通过一些算法将一些特征加密得到的值,这些值往往能够区分你是谁。每个客户端会生成特定的ja3指纹,并不会随ip和useragent改变,通过ja3指纹可以定位识别到某个客户端(不限于浏览器、python等)2、chrome浏览器查看ja3指纹:https://ja3er.com/json,或者https://ja3er.com/3、python的requests包查看ja3指纹import requestsheaders = {"User-Agent": "原创 2022-01-05 08:37:27 · 7524 阅读 · 6 评论 -
Python解析ofd文件
# encoding: utf-8import zipfileimport xmltodictimport requestsimport osimport shutildef unzip_file(zip_path, unzip_path=None): """ :param zip_path: ofd格式文件路径 :param unzip_path: 解压后的文件存放目录 :return: unzip_path """ if not unzi原创 2021-12-20 12:54:25 · 7593 阅读 · 1 评论 -
Python请求媒体Content-Type为multipart/form-data; boundary=----
如图案例:python请求post之multipart/form-data请求解决方法如下:导包:from collections import OrderedDict,from urllib3 import encode_multipart_formdata注意:headers的Content-Type里面的参数boundary一致性from collections import OrderedDictfrom urllib3 import encode_multipart_formdat原创 2021-10-19 20:09:54 · 4291 阅读 · 3 评论