
数据处理
Dcy_ASK
预测未来最好的方式是创造
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
re模块使用案例
写在前面的话:re模块当中有很多函数,但是以下三种:re.sub, re.findall, re.match 这三个命令是爬虫当中经常使用到的爬虫当中经常使用到re.sub,re.findall,re.match 进行数据清洗,提取,请务必掌握好这3个命令。接下来就是一些小案例,训练并掌握下对re.sub,re.finadll,re.match的运用以及对应输出的结果有一定的认知。findall:提取 ——>核心在于,要提取什么(定义个正则表达式,在哪里进行)sub:替换 ——>核原创 2020-11-18 21:04:00 · 216 阅读 · 0 评论 -
批量合并同类型文件
需求简述:电脑上下载了大量的以.xlsx文件,需要将.xlsx合并在一张.xlsx中,如果手动去合并太浪费时间而且容易出错当前存在的问题:1、xlsx存放在同一个文件夹,但文件夹中也存在其他类型的文件,比如.txt,以及pdf,而需求是只合并xlsx类型的文件2、各个xlsx表头可能会不一致import xlrdimport pandas as pdimport os```python指定存放文件的地址,也就是要去读哪个文件夹下的文件,这是一个绝对路径dir_str=r’D:\米家业务原创 2020-11-17 12:23:26 · 640 阅读 · 0 评论