- 博客(14)
- 收藏
- 关注
原创 利用Python和Dask高效处理大型CSV文件:数据中关键词的筛选(提取和删除包含关键词的行)~可处理超大数据
实现功能一:Python实现根据某列中找到的从原始数据中过滤行,然后匹配到关键词的行数据保存到新的 CSV 文件中;实现功能二:从原始数据中删除“删除的关键字”列中找到的任何关键字的行,然后将剩余数据保存到新的 CSV 文件中 ~程序升级优化版本)
2024-07-02 09:00:00
1325
原创 利用插件快速提取数据中的省市县信息——介绍一种超好用的excel数据辅助处理插件~方方格子
利用插件快速提取数据中的省市县信息——介绍一种超好用的excel数据辅助处理插件~方方格子
2024-07-02 09:00:00
630
原创 使用 Dask 进行数据清洗和统计分析即利用Python去除文件中重复的值并统计数据的出现次数(程序升级优化)~可处理超大数据
实现功能:该程序读取一个 CSV 文件,删除空值,计算每个值的出现次数,并将结果按出现次数排序后保存到新的 CSV 文件中
2024-07-01 20:12:14
1037
1
原创 高效处理和合并重复数据:使用Dask合并两个CSV文件并求和相同列的数据
Dask是一个并行计算库,旨在扩展Python的生态系统。它允许我们在本地或集群中处理数据,并提供与Pandas兼容的DataFrame API,这使得从Pandas过渡到Dask变得相对容易。
2024-07-01 19:49:27
613
原创 Python实现批量拆分企业名称(程序升级优化)~可处理超大数据
帮对象处理所需数据时写的代码——第八弹(实现功能:Python将公司名称拆分成地点,品牌名称,行业名称,公司后缀四部分)
2024-07-01 19:28:42
476
原创 Python提取数据中包含关键词的行及用Python去除数据中包含关键词的行
实现功能一:Python实现根据某列中找到的关键字从原始数据中过滤行,然后匹配到关键词的行数据保存到新的 CSV 文件中;实现功能二:从原始数据中删除“删除的关键字”列中找到的任何关键字的行,然后将剩余数据保存到新的 CSV 文件中
2023-07-26 20:23:13
3336
1
原创 Python实现合并不同文件夹内的多个csv文件及命令端快速合并单个文件夹的csv文件(根据实际情况自取两种方法之一即可) 并介绍一种查看器EmEditor辅助大型csv文件的查看编辑
Python实现合并不同文件夹内的多个csv文件;命令端快速合并单个文件夹的csv文件;最后介绍一款好用的文本编辑器EmEditor
2023-07-18 15:51:22
4360
8
原创 通过邮编查地址——第二种方式(可以实现邮编一键批量查询,省市县分开输出)
可以快速实现查询excel表格里所有邮编对应的地址信息,输出的省市县信息分开在不同的单元格中
2023-07-05 22:56:10
778
2
原创 Python检查excel某一个列是否包含另一个excel列中的元素,并将其匹配出来放在表格中
实现功能:根据表格一中的经济排名前五的地区,从表格二中匹配相应的县信息,并将匹配结果添加到表格一中的县列,最后保存到新的Excel文件中,两表格输入数据可根据需要选择
2023-07-05 22:55:59
2506
原创 通过邮编查地址——第一种方式(可以实现邮编一键批量查询,省市县一起输出)
代码根据邮政编码从网站检索位置信息,并将结果保存在 Excel 文件中。以下是其功能和优点的总结:功能:该程序通过使用提供的邮政编码向网站“ https://www.youbianku.com/ ”发送 HTTP GET 请求来获取位置信息,使用 XPath 从网站获得的 HTML 响应中提取位置信息。该程序创建一个新的 Excel 文件并将邮政编码和相应的位置信息写入其中。它提供了一个进度条,使用该tqdm库来跟踪输入 Excel 文件中行的处理情况。
2023-07-05 22:53:10
1914
4
原创 Python调用百度翻译API翻译excel中的所有英文(无翻译上限)
Python调用百度翻译API翻译excel中的所有英文(无翻译上限) 功能:该程序使用百度翻译 API 将文本从一种语言翻译成另一种语言。它支持批量翻译指定输入文件夹内的多个Excel文件。它将文本分割成更小的块以符合 API 的字符限制,并单独处理每个块的翻译。该程序将翻译结果添加为 Excel 文件中的新列,并将其保存在指定的输出文件夹中。它使用多线程来ThreadPoolExecutor并发执行翻译任务,通过利用多个线程来提高性能。优点:易于使用,高效处理
2023-07-04 22:51:11
2270
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人