如何将一个文件夹中所有excel文件合并成一个excel文件

使用pandas在Python中合并多个Excel文件的操作,
本文介绍了如何使用Python中的pandas库,通过循环遍历指定文件夹内的Excel文件(.xlsx和.xls),逐个读取并合并数据,最后将合并后的数据保存为新的Excel文件。

import pandas as pd  
import os  
  
# 指定包含Excel文件的文件夹路径  
folder_path = 'path/to/folder'  
  
# 获取文件夹中所有Excel文件的文件名  
excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx') or f.endswith('.xls')]  
  
# 创建一个空的DataFrame用于存储合并后的数据  
merged_df = pd.DataFrame()  
  
# 循环遍历所有Excel文件  
for file in excel_files:  
    # 读取Excel文件  
    df = pd.read_excel(os.path.join(folder_path, file))  
    # 将当前文件的数据添加到merged_df中  
    merged_df = pd.concat([merged_df, df])  
  
# 将合并后的数据保存到一个新的Excel文件中  
merged_df.to_excel('merged_data.xlsx', index=False)

一个文件夹中所有xls文件合并一个xls文件,可以通过Python实现,具体步骤和代码如下: #### 实现步骤 1. **导入所需的库**:需要导入`pandas`和`os`库。`pandas`用于处理Excel数据,`os`用于文件文件夹操作。 2. **准备工作**: - 设置包含需要整理的Excel文件文件夹路径。 - 初始化一个空的`DataFrame`,用于存储合并后的数据。 3. **读取/整理数据**: - 遍历文件夹中的所有文件,检查文件扩展名是否为`.xls`。 - 对于每个Excel文件,使用`pandas.read_excel()`函数读取数据。 - 使用`pandas.concat()`函数将读取的数据追加到总表`all_df`中。 4. **写入数据**:将合并后的`DataFrame`保存到一个新的Excel文件中。 #### 示例代码 ```python import pandas as pd import os # 设置文件夹路径 folder_path = 'your_folder_path' # 初始化一个空的DataFrame,用于存储合并后的数据 all_df = pd.DataFrame() # 遍历文件夹中的所有文件 for filename in os.listdir(folder_path): if filename.endswith('.xls'): file_path = os.path.join(folder_path, filename) # 读取Excel文件 df = pd.read_excel(file_path) # 将读取的数据追加到总表中 all_df = pd.concat([all_df, df], ignore_index=True) # 将合并后的DataFrame保存到一个新的Excel文件中 output_file = 'merged_file.xls' all_df.to_excel(output_file, index=False) ``` ### 注意事项 - 上述代码仅测试了文件夹中原始文件格式全为`.xls`的情况,未测试同一个文件夹中同时存在`.xls`文件和`.xlsx`文件,甚至还带有`csv`文件的情况,以及同一个文件夹中的不同文件列数不一样的情况 [^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值