自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

转载 HarmonyOS鸿蒙学习笔记 @Consume和@Provide作用说明和简单案例

@Consume和@Provide作用说明

2024-01-16 13:27:35 472

原创 如何实现上传到oss的图片只能在本网站上访问,直接访问oss文件链接不能下载不能访问

通过以上步骤,只有在你的网站上获取到了有效签名的请求才能进行图片的上传和访问,从而实现了只能在本网站上访问上传到 OSS 的图片,而不能直接下载或访问 OSS 文件链接。- 在服务端生成一个用于签名的密钥(Access Key),该密钥只在服务端保存,不会暴露给前端,可以通过类似阿里云的服务SDK来操作。3. 在你的网站后端代码中,上传图片到 OSS 存储桶时,需要生成一个访问授权凭证(签名)。- 在此接口中,使用服务端密钥对请求进行签名,生成图片的临时访问链接,并返回给前端。

2023-11-09 13:44:20 2595

原创 php+websocket+微信小程序

【代码】php+websocket+微信小程序。

2023-09-14 13:48:09 272

原创 display flex

Flex是FlexibleBox的缩写,意为"弹性布局",用来为盒状模型提供最大的灵活性。设为Flex布局以后,子元素的float、clear和vertical-align属性将失效。

2023-08-30 11:08:48 309

转载 设置open_basedir防止跨站攻击

通过设置open_basedir将 PHP 所能打开的文件限制在指定的目录树,包括文件本身。本指令不受安全模式打开或者关闭的影响。

2023-02-06 13:54:04 1275 1

原创 JS逆向爬虫(二)

JS逆向是在爬虫或POC脚本访问请求时,连接请求需要携带动态生成的请求头参数,比如常见的csrf请求头,诸如此类的限制来实现反爬

2023-01-12 09:57:32 1257 1

原创 JS逆向爬虫(一)

S逆向是在爬虫或POC脚本访问请求时,连接请求需要携带动态生成的请求头参数,比如常见的csrf请求头,诸如此类的限制来实现反爬

2023-01-04 18:07:26 2199

原创 识别验证码

识别此类验证码,首先需要找到验证码图片在网页HTML代码中的位置,然后将验证码下载,最后在通过OCR技术进行验证码的识别工作

2023-01-03 17:35:21 3688

原创 Tesseract(识别验证码)

Tesseract是一个将图像翻译成文字的OCR(光学文字识别,Optical Character Recognition),最初由 HP 公司开发,目前由谷歌赞助。Tesseract是目前公认最优秀、最准确的开源OCR库。Tesseract具有很高的识别度,也具有很高的灵活性,他可以通过训练识别任何字体

2022-12-30 15:28:14 1266

原创 APP抓包工具

随机互联网的发展,数据不仅仅只是存在于PC端。移动端的数据在这几年的占比以及势头发展趋势呈现几何倍数的增长。对于做数据分析、用户画像、市场调研来说仅仅参考PC端的数据是远远不够的。那么于此同时移动的数据就显得尤为的重要

2022-12-29 15:04:40 5487

原创 多线程与多进程爬虫(持续更新中...)

由于线程是操作系统直接支持的执行单元,涉及两个模块:_thread(低级模块)和threading(高级模块),threading对_thread进行了封装,一般使用threading这个高级模块。

2022-12-28 15:25:49 673

原创 scrapy-Redis分布式

scrapy是一个基于redis的scrapy组件,用于快速实现scrapy项目的分布式部署和数据爬取

2022-12-15 23:34:28 153

原创 MongbDB与Python的交互

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

2022-12-13 23:53:33 175

原创 MongoDB

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

2022-12-09 09:17:02 190

原创 Splash的爬虫应用

Splash是一个JavaScript渲染服务,它是一个带有HTTP API的轻型WEB浏览器,Python可以通过HTTP API调用Splash中的一些方法实现对页面的渲染工作。同时还可以使用Lua语言实现页面的渲染,所以使用Splash同样可以实现动态渲染页面的爬取

2022-12-07 18:33:55 1342 1

原创 Selenium(səˈliːniəm)库的使用(1)

selenium是一个web的自动化测试工具,最初是为网站自动化测试而开发的,selenium可以直接运行在浏览器上,它支持所有主流的浏览器,可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏

2022-12-02 16:36:42 1474

原创 解析数据的Beautiful Soup模块

Beautiful Soup是一个用于从HTML和XML文件中提取数据的Python模块

2022-12-02 11:23:17 187

原创 XPath解析

XPath是XML路径语言,是一门可以在XML文件中查找信息的语言

2022-12-01 18:21:29 1105

原创 正则表达式

re模块中的search()方法用于在整个字符串中搜索第一个匹配的值

2022-12-01 18:13:32 816

原创 Requests-Cache

该模块用于为requests模块提供持久化缓存支持,如果requests模块向一个URL发送重复请求时,Requests-Cache模块将会自动判断当前的网络请求是否产生了缓存。如果已经产生了缓存,就会从缓存中读取数据作为响应内容。如果没有缓存就会向服务器发送网络请求,获取服务器所发返回的响应内容。使用Request-Cache模块可以减少网络资源避免重复请求的次数,这样可以变相的躲避一些反爬机制

2022-12-01 18:04:32 421

原创 Requests-HTML

Requests-HTML模块和requests是同一个人开发者所开发的。Requests-HTML模块不仅包含了requests模块中的所有功能,还增加了对JavaScript的支持,数据提取以及模拟真实浏览器等功能。

2022-12-01 17:56:38 1368 4

转载 MySQL之KEY分区和LINEAR KEY分区

MySQL之KEY分区和LINEAR KEY分区

2022-10-18 14:38:40 1209 1

转载 mysql 分区分表_mysql分库分区分表

mysql 分区分表_mysql分库分区分表

2022-10-18 14:14:08 2104

转载 mysql 四种分区方式

mysql 四种分区方式

2022-10-18 13:54:49 5200

原创 服务器压测的几个关键词

压测的几个关键词,这里总结一下

2022-10-18 09:24:27 566

js反爬 + js反爬、pythono + 用python模拟有道笔记 + 可以用该程序自己做一个小软件

内容:模拟有道翻译 适用人群:初学者学习js反爬

2023-01-13

字体反爬,案例:以闪职网站为例

以闪职网站为例,做一个字体反爬的案例,适合刚学习的朋友,用在网页中文字被加密,需要使用反爬工具进行替换对应被加密的文字

2023-01-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除