自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 python之requests库解析

本文讲requests的基本使用

2025-07-09 17:15:59 17601

原创 ddddocr库的使用(识别图片,滑块,点选识别)

本文讲ddddocr基本使用。

2025-07-08 17:25:22 18539

原创 Scrapy进阶封装(第六阶段:Selenium模板封装)

本阶段在模板的基础上增加自动化封装方法,包括获取网页源码,获取网页cookie,点击,控制浏览器,等等方法。

2025-07-07 17:09:39 17635

原创 Scrapy进阶封装(第五阶段:爬虫模板初步封装,简化请求和翻页功能)

本阶段讲解爬虫模板初步封装,包括简化请求方法,简化翻页方法,要有基础,掌握此章节,爬虫开发效率进一步提高,此框架一般用于企业级项目。

2025-07-07 15:17:59 17050

原创 Scrapy进阶封装(第四阶段:中间件设置,动态UA,ip代理池)

本文讲中间件封装,ip代理池,动态ua等。

2025-07-05 14:04:55 17498

原创 Selenium使用教程-爬虫版(超详细)

本文主要讲selenium在爬虫的使用

2025-07-02 16:31:56 17933

原创 Scrapy进阶封装(第三阶段:多管道封装,多文件存储)

本文主要讲scrapy多管道封装。多种数据存储

2025-06-26 15:31:20 17487

原创 Scrapy进阶封装(第二阶段:源码解释,重写方法,函数回调)

本文详解自定义请求,重写方法,源码解释,深度请求等等

2025-06-26 10:40:27 17530

原创 json.decoder.JSONDecodeError: Unexpected UTF-8 BOM (decode using utf-8-sig)

json.decoder.JSONDecodeError: Unexpected UTF-8 BOM (decode using utf-8-sig): line 1 column 1 (char 0) 意思是叫你用utf-8-sig编码。有一次爬虫遇到了json的字符串响应对象。然后转为json对象。

2025-06-24 16:30:37 3752

原创 Scrapy进阶封装(第一阶段:环境搭建,基本使用)

scrapy使用了异步网络框架,可以加快我们的下载速度。底层已经封装好并发能力。scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取。底层已经封装好了,可以进行二次封装。

2025-06-24 16:22:47 31955

原创 PythonIP代理池搭建

代理ip,主要保护用户的个人数据和信息安全,提高用户上网的安全。

2025-06-21 16:08:02 17312

原创 Python数据分析jupyter的基本使用

Jupyter Notebook是以网页的形式打开,可以在网页页面中和,代码的也会直接在代码块下显示的程序。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。一般用于数据分析。很方便。首要准备会自动在浏览器打开,但有些电脑配置不一样,自动打不开,可以手动网址打开界面如下(内容请忽略,我随便找一个文件下打开的)接下来创建文件,python3文件创建好了点击Untitled可以改名字根目录就创建这个被称为单元格,两个状态,选中状态和编辑状态,

2025-06-20 14:46:34 17390

原创 Python关于垃圾回收机制

Python的垃圾回收机制以引用计数为主,标记清除和分代回收为辅。引用计数可以实时回收不再使用的对象,而分代回收则负责处理循环引用,并按代管理对象以提高效率。在大多数情况下,开发者无需关心垃圾回收,但在处理循环引用或性能敏感场景时,了解这些机制有助于优化程序。

2025-06-19 17:14:52 1216

原创 python爬虫关于多进程,多线程,协程的使用

本文章的案例仅供学习。若因个人不当行为引发问题,责任与本人无关。

2025-06-18 14:32:40 18110

原创 爬虫遇到base64编码(非常规版)

工作中遇到两个关于base64编码的问题。

2025-06-09 17:38:29 3833

原创 python爬虫之数据存储

在爬虫接单里,数据存储是一定要学的。本文讲数据存储,包括文本,csv,json,mysql,mongodb等等。

2025-06-09 17:27:36 18191

原创 python每日剂量(2)探讨Python中不同解析库的提取速度对比

1.scrapy自带Css选择2.scrapy自带xpath3.lxml自带xpath from lxml import etree4.bs4自带美味的汤 from bs4 import BeautifulSoup5.re 正则表达式以这个文本为例,在循环解析链接标题时间情况,再循环499次并打印输出,约循环7500次,为了避免误差,考虑到CPU资源波动,那么Python程序能够得到的CPU时间就会或多或少,从而导致运行时间变长或变短,所以每种方式运行三次。当CPU爆满时。

2025-05-26 16:52:24 563

原创 Python每日剂量(1) pyfigle和colorama

今天介绍两个有趣的库,pyfiglet和colorama,作用分别如下pyfiglet用这两个库生成。让终端(命令行)输出彩色文字,支持跨平台(Windows/macOS/Linux)的文本颜色控制。Fore效果如下。

2025-05-26 10:31:06 17005

原创 playwright 免API实现kimi聊天机器人

窃取神通!!!

2025-04-24 17:27:23 3867

原创 爬虫之自动化工具 Playwright

本文讲playwright在爬虫的应用。主要讲playwright基本操作。获取cookie过瑞数等安全产品,模拟登录获取cookie,免api直接实现kimi聊天机器人,模拟过验证码等等。有些还没更新完。

2025-04-24 17:17:18 19403

原创 JS逆向之加速乐

本文主要讲加速乐请求过程。

2025-04-18 17:12:33 18369

原创 JS逆向之补环境入门

JS补环境

2025-04-14 17:32:09 19688

原创 JS逆向之JS混淆

本文主要ob混淆特征。

2025-04-12 15:57:48 19133 1

原创 JS逆向之Wasm逆向过程

主要讲wasm逆向过程及调用wasm过程。

2025-04-11 10:46:19 20642

原创 JS逆向之Webpack打包方式(实战案例)

本文讲webpack打包方式,可以对代码进行分割,按需加载模块,提高爬虫性能。

2025-04-09 17:15:35 19478 2

原创 JS逆向关于网页的异步调试(实战案例)

对于简单非异步逆向的网站,搜索关键词或者hook技术一般都能得出加密的位置,要么就是跟几个栈就能找出加密的位置。对于一些混淆和异步的位置,我们很难找到加密的位置,本文着重介绍异步调试的技巧,只做学习,侵权立删。

2025-04-08 16:05:44 5443

原创 爬虫逆向常见的对称加密

DES是一种分组加密算法,他以64位为分组对数据加密。64位一组的明文从算法的一端 输入,64位的密文从另一端输出。DES是一个对称算法:加密和解密用的是同一个算法(除 密钥编排不同以外)。密钥的长度为56位(密钥通常表示为64位的数,但每个第8位都用作奇偶检验,可以忽 略)。密钥可以是任意的56位数,且可以在任意的时候改变。DES。其中Key为8个字节共64位,是DES算法 的工作密钥;Data也为8个字节64位,是要被加密或解密的数据:Mode为DES的工作方式,有 两种:加密或解密。

2025-04-01 14:59:48 19129

原创 爬虫逆向常见的哈希算法

本文不讲哈希的原理过程,只讲哈希的特征,以及哈希代码的实现。

2025-03-27 15:36:53 4702

原创 Python调用JS代码大全

你可以在 Python 中执行 JavaScript 代码,而无需启动一个完整的 JavaScript 解释器。它的目标是提供一种简便的方式,使得在 Python 中嵌入 JavaScript 代码成为可能,特别是对于需要JavaScript 交互的项目而言。是一个 Python 库,用于在 Python 环境中执行 JavaScript 代码。它实际上是对 ExecJS 库的 Python 封装,ExecJS 本身是一个通用的 JavaScript 运行环境的抽象层。以上方法只针对非异步的js代码。

2025-03-27 14:37:12 17769

原创 JS逆向的常见hook技术(实战案例)

Hook 是一种钩子技术,在系统没有调用函数之前,钩子程序就先得到控制权,这时钩子函数既可以加工处理(改变)该函数的执行行为,也可以强制结束消息的传递。简单来说,**修改原有的 `JS `代码就是 Hook。客户端拥有 `JS` 的最高解释权,可以决定在任何时候注入` JS`,而服务器无法阻止或干预。服务端只能通过检测和混淆的手段,另 Hook 难度加大,但是无法直接阻止。

2025-03-24 16:57:32 5202

原创 JS逆向爬虫需要掌握的最基础JS知识

js逆向爬虫掌握的最基础的js知识,只能说够用,最好在学习一下。

2025-03-20 16:44:27 4742

原创 逆向爬虫入门案例(一) 某麦数据之扣代码

仅提供学习,若有侵权,联系删。

2025-03-16 00:29:22 4145 1

原创 django 流程大全(超详细)

django超详细。

2025-02-06 20:52:12 22412

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除