如何利用 pandas 批量合并 Excel？

最新推荐文章于 2024-07-19 10:50:07 发布

转载最新推荐文章于 2024-07-19 10:50:07 发布 · 533 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzU1MjYzNjQwOQ==&mid=2247501589&idx=2&sn=0db2d887c826d5543892b20abdb7ce8d&chksm=fbfd9d83cc8a1495e5f3f2efc362f355af2b23ffe379cf1d8279b4c1d367b8d9731d0f8cfc1c&scene=126&&sessionid=0

文章标签：

#excel #java #python #csv #大数据

本文介绍了如何使用Pandas将多个dataframe保存到同一个Excel文件的不同sheet中，通过创建ExcelWriter对象并逐个写入dataframe。示例代码展示了如何读取指定目录下的所有Excel和CSV文件，自动合并到一个Excel文件，sheet名对应文件名。这个方法简化了大量数据文件的整合工作。

今天分享一个利用Pandas进行数据分析的小技巧，也是之前有粉丝在后台进行提问的，即如何将多个pandas.dataframe保存到同一个Excel中。

其实只需要灵活使用pandas中的pd.ExcelWriter()方法即可。

假设现在我们有df1 df2 df3三个dataframe，需要将它们保存到同一个Excel的不同sheet中，只需要先创建一个ExcelWriter对象，然后不停写入就行

df1 = pd.read_csv('东京奥运会奖牌数据.csv')
df2 = pd.read_excel("TOP250.xlsx")
df3 = pd.read_excel("2020年中国大学排名.xlsx")

writer = pd.ExcelWriter('test.xlsx')
df1.to_excel(writer,sheet_name="df1",index=False)
df2.to_excel(writer,sheet_name="df2",index=False)
df3.to_excel(writer,sheet_name="df3",index=False)
writer.save()

是不是和常见的文件读写with方法类似，我们也可以使用同样的方法

with pd.ExcelWriter("test1.xlsx") as xlsxwriter:
    df1.to_excel(xlsxwriter,sheet_name="df1",index=False)
    df2.to_excel(xlsxwriter,sheet_name="df2",index=False)
    df3.to_excel(xlsxwriter,sheet_name="df3",index=False)

得到的结果是一样的，可以将多个df保存到一个Excel中

这个方法虽然简单好用，但是如果要保存的 df 太多了，一个一个手动去读取再手动去保存就显得十分麻烦，另外我们希望sheet是文件名，如果手动复制粘贴，就更麻烦了。

我们先简单拿来一个小脚本「获取指定目录下的全部Excel文件名」

import os
def getfile(dirpath):
    
    filelist = []
    for root,dirs,files in os.walk(dirpath):
        for file in files:
            if file.endswith("xlsx") or file.endswith("csv"):
                filelist.append(os.path.join(root,file)) 
    
    return filelist

执行一下，可以看到指定目录下的全部Excel文件名

下面要做的，我想不用多说了「循环读取，自动保存」

filelist = getfile('/Users/liuzaoqi/Desktop/zaoqi/2022公众号文章/如何保存多个df')
writer = pd.ExcelWriter('test.xlsx')
for file in filelist:
    if file.endswith("xlsx"):
        df = pd.read_excel(file)
    else:
        df = pd.read_csv(file)
    df.to_excel(writer,sheet_name=file.split('/')[-1].split('.')[0],index=False)
writer.save()

现在，当前目录下的全部Excel就自动合并到一个Excel中的不同sheet中，并且sheet名是对应的文件名