自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 Python | 进程、线程是什么?它们有何区别,如何运用,进程与线程介绍

进程与线程概念解析 进程与线程的关系可类比工厂车间和工人:进程相当于车间,线程相当于工人。通过增加线程(车间工人)或进程(工厂车间)可提高程序运行效率。串行程序通过多线程或多进程可转变为并发程序。 关键区别: 进程资源独立,线程共享进程资源 多线程适用于IO密集型任务(文件/网络操作) 多进程适用于计算密集型任务(大量数据计算) 实现方式: 多线程:使用threading模块,需注意线程安全(锁机制) 多进程:使用multiprocessing模块,适合利用多核CPU 优化技巧: 线程/进程池控制并发数量

2025-06-05 18:24:23 918

原创 影刀RPA | BOSS直聘薪资数据加密解决办法,网络监听实践应用

在使用影刀RPA从BOSS直聘获取薪资信息时,发现数据被加密。通过F12开发者工具,切换到NetWork选项并选择Fetch/XHR,可以观察到加载的数据中薪资信息未被加密。进一步分析发现,请求网站中包含'/job/detail.json'特征,刷新网页后确认此特征唯一。因此,只需监听'/job/detail.json'即可获取所需数据包。

2025-05-21 19:53:17 804

原创 Python | opencv实现视频抽帧,截取视频图片积攒训练集

在机器学习和计算机视觉领域,视频抽帧技术是构建训练集的有效方法。通过间隔一定时间抽取视频帧,可以快速生成大量图像数据。以《老友记》第一季第1集为例,使用Python的OpenCV库实现每3秒抽一帧的功能。代码首先读取视频文件,计算帧率并确定抽帧间隔,随后逐帧读取视频并保存指定间隔的帧为图片。最终,所有抽取的帧将保存到指定文件夹中,便于后续的图像处理或模型训练。这种方法不仅提高了数据收集的效率,还为图像分析提供了丰富的素材。

2025-05-09 15:27:52 581

原创 影刀RPA | 影刀使用教程,别人分享的应用怎么获取,有何限制?

需要注意的是,社区版运行分享的应用有单次运行时间限制(10分钟),想要长时间运行需要创业板以上版本。获取完成后,打开影刀应用,即可在"我获取的应用"中查看到。点击新建可搭建属于自己的自动化流程。打开影刀官网后下载应用并完成安装。新用户可获得30天创业板体验。打开链接,并完成登录,点击获取。没有账号的话点这里完成注册。

2025-05-09 15:03:06 3515

原创 爬虫实战 | 爬取美剧天堂影视,合并ts文件为mp4文件

Python | 爬虫实战,爬取美剧天堂影视,合并ts文件为mp4文件

2025-05-06 20:12:46 994

原创 Python | Python基础知识讲解,零基础入门笔记

整数(int表示整数值,如42-10。支持任意大小的整数(仅受内存限制)。浮点数(float表示小数或科学计数法数值,如3.142e5。精度受限于双精度浮点数(可能存在精度问题,如0.1 + 0.2!= 0.3布尔值(bool只有True或False两个值,是int的子类(True == 1False == 0字符串(str不可变序列,用单引号' '或双引号" "定义,如"hello"。支持切片、拼接、格式化(如f"{}")等操作。元组(tuple不可变有序序列,用(,)定义,如。

2025-04-29 17:48:49 785

原创 影刀RPA | 如何给Excel表格加边框?设置单元格边框指令 - 自定义指令教程

在影刀RPA中,想要设置单元格边框需要在Excel表内指出,略显麻烦,所以开发了一个自定义指令,用于设置单元格边框。边框样式,边框颜色设置为下拉框,上下左右边框设置为复选框。保存发版,这样在搭建其他应用时就可以调用这个自定义指令啦。需要注意的是,运行该指令前,需先关闭Excel表格。新建python模块,记得导入openpyxl包。右键主流程,点击指令编辑。

2025-04-26 14:51:32 1165

原创 Python库 | openpyxl介绍,用代码操作Excel工作表

openpyxl 是一个用于读写 Excel 2010 及以上版本文件(.xlsx、.xlsm、.xltx、.xltm)的 Python 库,支持通过编程方式自动化操作 Excel 文件,包括数据读写、样式设置、图表生成等。新建一个工作簿打开已有工作簿保存工作簿获取工作簿中所有sheet页新建一个工作表sheet页选择sheet页修改sheet页名称复制sheet页移动sheet页获取Sheet页数据信息。

2025-04-25 17:47:15 810

原创 Xpath | XML Path Language语法规则总结

XPath(XML Path Language)是一种用于在XML和HTML文档中查找信息的语言,它通过路径表达式来选取文档中的节点或节点集。选取属于bookstore元素的book元素的所有title元素,以及文档中所有的price元素。选取bookstore元素的所有book元素,且其中的price元素的值须大于35。选择属于bookstore元素的后代的所有book元素。选取属于bookstore的子元素的所有book元素。选取所有属于当前节点的子元素的book节点。

2025-04-24 18:52:14 1293

原创 影刀RPA | 多窗口截图大小不统一,如何规范化指纹浏览器网页大小?

想要规避这个问题,可以用键盘输入指令设置快捷键Ctrl+0快速恢复到100%的网页大小,搭配调整窗口状态指令设置最大化,实现统一截图大小。使用影刀RPA截取比特等指纹浏览器网页元素时,时常会因为各窗口大小不同及网页缩放等原因,导致截取图片大小不一致。除此之外,还可以使用快捷键 Ctrl+- 或 Ctrl++ 来实现网页大小的缩放。

2025-04-23 17:35:09 836

原创 影刀RPA | 如何建立与飞书多维表格的连接?

飞书多维表格是一款强大的数据分析工具,支持多维度的数据分析,帮助企业快速洞察数据背后的商业价值。而影刀RPA是一款强大的自动化工具,这两款应用如何强强联合呢,影刀RPA如何写入数据至多维表格?

2025-04-22 18:57:27 1907

原创 影刀RPA | 不进入笔记详情页,批量下载小红书笔记视频/图片素材,http请求详解

而且还不能是小窗口打开,必须全页面显示才能看到,这就有点麻烦了,按这个方式采集,效率将大打折扣。爬取到的笔记内容是这样的,可以发现内容都,集中在这里,对数据进行下处理即可,处理结果如下。返回值是以字典形式的,对于图文笔记,返回的视频值为None,下载素材时可对视频变量做个判断。在使用影刀RPA获取小红书视频元素链接时,会发现获取到的链接是错误的,无法下载。随便打开一个笔记,在过滤框输入"feed"或"search"进行过滤。解决方式如下,在请求头headers中写入个人登录的Cookie值。

2025-04-20 15:02:18 1767

原创 影刀RPA | 如何使用RPA采集小红书主页笔记,运行报错避坑指南

使用影刀开发小红书数据采集的朋友应该会遇到这样一个问题,使用懒加载指令时常会报出找不到指定ID元素的错误,即使按照影刀社区提供的解决方法处理也有概率报错

2025-04-20 14:52:11 1347

原创 影刀RPA | 学会Http请求,快速获取B站搜索结果及其播放量等数据

以b站为例,我们可以快速爬取到B站的搜索结果,并获取到它的播放量等数据

2025-04-19 17:07:44 573

原创 影刀RPA | 比特浏览器不同分组的窗口如何分开调用?影刀插件如何安装?

本篇文章主要介绍比特浏览器的 API 调用具体方式,其中包括窗口 ID 的获取途径、窗口的启动与关闭指令,还有影刀插件的安装办法。

2025-04-19 16:53:38 1680

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除