自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 问答 (1)
  • 收藏
  • 关注

原创 Excel正则表达式.获取字符

摘要:Excel正则表达式函数(REGEXTEST、REGEXEXTRACT、REGEXREPLACE)通过模式匹配实现高效文本处理,包括验证、提取和替换操作。核心语法包含基础字符匹配([a-z]、\d)、边界限制(^$)、量词(*+?{})和特殊匹配(\s\n)等。典型应用包括提取中文字符([一-龟]+)、字母数字([a-zA-Z0-9]+)以及文件类型匹配(.+.pdf$)。这些函数特别适用于处理复杂文本格式和数据清洗任务,能显著提升表格数据处理效率。

2025-10-30 09:46:07 720

原创 Excel工具

公式-根据所选内容创建-首行-数据-数据验证-设置-允许(序列)-引用一级菜单。数据-数据验证-设置-允许(序列)-引用-【 =indirect(E2) 】

2025-07-22 18:50:15 138

原创 拆分、合并PDF

将所有PDF文件放在同一个目录中(如。

2025-07-22 10:59:42 313

原创 Python PDF转excel

PDF转excel

2025-02-19 10:00:11 419

原创 Excel数字转中文大写函数、万元单位

Excel数字转中文大写函数、自定义单元格式万元单位

2025-01-09 11:06:41 392

原创 PyPDF3 拆分PDF

拆分合并PDF

2024-11-19 11:34:50 610

原创 MS office 难题

通过数据验证单元格,引用数据内容,生成动态图表(1)设置数据验证(2)单元格生成名称,为了单独引用指定产品的数值步骤:选择区域-公式-根据所选内容创建-勾选【首行】(3)建立引用位置indirect(单元格):间接引用单元格的地址(4)图表数值引用。

2024-09-09 20:47:52 602

原创 备考MS office 二级

MS office 二级必过

2024-09-05 20:18:19 1836

原创 Pandas03

聚合计算时新增一列计算最大值与平均值的差值df.groupby('district').agg(最低工资=('salary', 'min'), 最高工资=('salary', 'max'), 平均工资=('salary', 'mean'), 最大值与均值差值=('salary', myfunc)).rename_axis(["行政区"])

2024-05-27 15:48:17 2350

原创 批量合并PDF

【代码】批量合并PDF。

2024-02-28 11:31:22 289

原创 Excel函数

VLOOKUP(F6&G6,IF({1,0},C:C&D:D,E:E),2,0):是将A:A&B:B和C:C和成两列数据。比较示例1和示例2的结果,发现公式只是多了一个参数,但其结果却相差很大,所以在一定要清楚当Unique函数的第3个参数为TRUE时,返回的值时指定区域中仅出现1次的唯一值。结合数据表,要查询“产品”的最新“批发价”,其实就是从数据表的最后一行逆向向第一行查询,结合Xlookup的特点,只需将第6个参数的值设置为-1即可。此用法是Unique函数的最基础的用法,也是最常用的功能。

2024-02-19 10:06:03 3142

原创 Python最常用的代码

5、将列表压缩成一个字符串。4、跟踪列表中元素的频率。6、获取列表中元素的索引。1、单行循环List。

2023-10-16 15:12:54 201

原创 Pandas对行/列求和

Pandas对行/列求和

2023-05-29 21:45:19 7943

原创 Pandas排序和分组排名(sort和rank)

按部门分组排名

2023-05-28 18:15:36 1388

原创 PowerQuery行转列、列转行、转置、逆透视

操作:表格上方新建一行,【转置】-【向下填充】-选择【日期、姓名】-【逆透视其他列】操作:选择日期向下填充,选择【日期、季度】-【逆透视其他列】操作:选择【姓名】-【逆透视其他列】

2023-05-18 16:58:01 11570

原创 PowerQuery合并、汇总、分组依据

合并查询:原表进行查询左外:批量vlookup数据源需指定列,两表对应的列。

2023-05-18 16:31:39 6014

原创 python 提取字符串的数字,提取列表的重复元素

【代码】python 提取字符串的数字,提取列表的重复元素。

2023-05-16 15:26:24 450 1

原创 PowerBI 制作日历表、计算每月实际天数

PowerBI 制作日历表、计算每月实际天数

2023-05-11 20:46:13 4078

原创 Python 求每月的天数

【代码】Python 求每月的天数。

2023-05-11 20:41:34 3028

原创 python xls 转 xlsx

【代码】python xls 转 xlsx。

2023-05-11 09:22:39 3168 2

原创 Excel进入PowerQuery

新建空白工作簿-【数据】-【获取数据】-【来自文件】-【从工作簿】-选择Excel文件。单击数值区域单元格-【数据】-【来自表格/区域】-确定。-勾选【选择多项】-勾选需要的工作表-【转换数据】

2023-04-30 21:49:01 865

原创 Python列表字符转为数值

列表字符转换为数值三种方法:循环、列表生成式、numpy(推荐)

2022-12-18 13:46:15 10093

原创 PowerQuery多种分隔符进行分列

PowerQuery多种分隔符进行分列

2022-12-13 15:55:18 1239

原创 python操作文件(办公自动化)

批量创建文件夹创建多个层级目录当前路径下创建多个层级目录创建文件文件整理os.scandir获取文件名、文件路径、判断是否文件夹层级搜索获取指定路径

2022-10-19 16:03:24 639

原创 python 操作Excel入门到进阶

python操作exce

2022-10-03 17:40:39 4967 1

原创 python glob通配符方式单/多层搜索文件/文件夹

glob实现同层和多层级搜索

2022-10-03 17:34:04 2193

原创 用Selenium爬虫

selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit,完全由JavaScript编写,因此可以用于任何支持JavaScript的浏览器上。selenium可以模拟真实浏览器,自动化测试工具,支持多种浏览器,爬虫中主要用来解决JavaScript渲染问题。

2022-09-21 11:27:24 213

原创 PowerQuery多文件合并透视

PowerQuery多文件合并透视

2022-09-17 19:22:00 3001

原创 用shell测试获取的元素

适用于深度爬虫

2022-09-13 18:21:53 248

原创 scrapy爬取百度多页图片

在scrapy中我们可以使用ImagesPipeline这个管道类来进行相关操作,这个类是scrapy已经封装好的了,我们直接拿来用即可。

2022-08-25 20:17:37 622

原创 scrapy爬虫框架(番组、豆瓣250案例)

两种存储方法:1、基于终端命令的持久化存储2、基于管道的持久化存储

2022-08-17 17:09:04 344

原创 python滑动验证

网易易盾滑动验证

2022-08-16 20:02:57 1345 1

原创 pycharm安装/卸载库的方法

安装库的三种方法.卸载模块

2022-08-11 09:35:59 9826

原创 爬虫bs4解析

使用bs4爬取漫画排行榜

2022-08-09 13:10:45 493

原创 python存储JSON

导入模块:import json。

2022-08-03 11:43:57 14570

原创 Pandas01

当header=None时,指定names参数,即自定义各列名称。

2022-07-22 11:51:18 519

原创 Numpy02

布尔掩码:掩码相当于一把有洞的尺子,洞就是条件,当尺子放在数组上面,掩盖住的就是不符合条件的数字,显示出来的就是我们需要的数字。

2022-07-20 17:27:01 1143

原创 numpy

目录1、从列表生产数组2、用函数生产规律性数组3、用函数生成随机数组4、numpy读取文件5、整体运算(聚合函数、点击运算、权重、axis)

2022-07-16 21:58:19 566

原创 python批量读写百千文件

os.listdir(文件夹名称)os.walk(目录名)os.rename(原名,新名)endswith(文件后缀)

2022-07-15 16:07:29 380

原创 python使用xlwings操作excel-1

通过xlwings操作Excel的过程就是逐层创建对象。使用xlwings读写单元格的基本步骤为:1、使用xlwings.App() 创建App对象,代表Excel进程;2、使用app对象books属性的open或add方法,打开或新建Excel工作簿,并得到代表该工作簿的Book对象;3、使用Book对象Sheets属性,得到代表某工作表的Sheet对象;4、使用Sheet对象的range方法,得到代表指定单元格区域的Range对象;5、使用Range对象的value属性............

2022-07-15 11:36:31 3440

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除