工作和实践中有这个需求,试了用excel的工具都没成功,写了一段python代码实现了。大概步骤如下:
【准备工作】将需要合并的文件放到一个文件夹中
【开始爬取】
1.导入相关的库
import os
import pandas as pd
2.查看并输入文件夹所在路径
# 在下方输入需要合并的文件所在文件夹位置
path='C:/Users/lenovo/Desktop/数据_合并版/'
# 在下方输入合并后Excel的路径和文件名
output_path='C:/Users/lenovo/Desktop/output.xlsx'
# 新建一个sheet
# sheet=work.add_worksheet('combine')
3.读取文件列表并按字母排序
file_list = os.listdir(path) #读取文件列表
file_list.sort()#排序
4.创建空的DataFrame,用于存储合并后的数据
# 创建一个空的DataFrame,用于存储合并后的数据
combined_data = pd.DataFrame()
fileNum = len(file_list)
print("在该目录下有%d个xlsx文件" % fileNum)
5.开始合并
for file in file_list:
if file.endswith('.xlsx'):
file_name = os.path.join(path, file)
# 读取Excel文件的数据
df = pd.read_excel(file_name)
# 将数据添加到合并的DataFrame中
combined_data = combined_data.append(df, ignore_index=True)
print('已完成 ' + file_name)
else:
continue
# 将合并后的数据写入新的Excel文件
combined_data.to_excel(output_path, index=False)
print("已将%d个文件合并完成" % fileNum)
参考资料:
希望能帮助到大家~