如何合并多个 CSV 文件?用 8 行代码实现

当需要合并大量具有相同结构的CSV文件时,手动操作变得繁琐且易错。本文介绍了一种使用Python通过8行代码实现批量合并CSV文件的方法,包括设置工作目录、匹配CSV文件和利用pandas进行合并导出,特别处理了非英语字符的编码问题。
部署运行你感兴趣的模型镜像

如何合并多个 CSV 文件?用 8 行代码实现

 

为什么需要合并多个 CSV 文件?

如果你不需要操作太多文件,那么可以直接手动复制粘贴。

但是,假设你要连接的文件超过 100 个,你还愿意手动操作吗?重复执行此操作很繁琐,而且容易出错。

如果所有文件都具有相同的表结构(相同的标题和列数),则可以使用这个简单的 Python 脚本来完成

第一步:导入包,设置工作目录

将 “/ mydir” 更改为所需的工作目录。

import os
import glob
import pandas as pd
os.chdir("/mydir")

第二步使用 glob 匹配模式 “csv”

匹配模式(“csv”),然后将文件名列表保存在 “all_filenames” 变量中。你可以查看此链接,以了解有关正则表达式匹配的更多信息。

extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]

第三步:合并列表中的所有文件并导出为 CSV

使用 pandas 连接列表中的所有文件,并导出为 CSV。输出文件位于你的工作目录中,名为 “combined_csv.csv”。

#在列表中合并所有文件
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames ])
#导出 csv
combined_csv.to_csv( "combined_csv.csv", index=False, encoding='utf-8-sig')

添加了 encoding = ‘utf-8-sig’,以解决导出“非英语”语言时遇到的问题。

好了,完成啦!

 

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成
Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值