背景: 我们有项目问题记录的表格,每一个项目都会反馈来一个execl表格,表格的格式都是统一的,我需要定期把这些项目上反馈来的表格进行统计,但是表格非常多,我要每个都统计出来在来相加,这样操作很麻烦,所以我想有没有一个方法可以把所有的execl 都合并成为一个execl ,然后再去做统计分析 。这样会节省不少时间。最后我发现可以用python 来做合并execl的事情。
1、目录结构

- util : 是工具包,里面是封装的execl的类,实现了execl的基本操作
- sources : 这里存放的需要进行合并的所有execl文件
- results : 存放合并后的execl文件
- main : 主函数 实现execl合并的方法
2、实现过程
ExcelUtil类的实现
在util包里面创建excel_util.py文件
导入相关的模块,实现ExcelUtil的初始化方法
初始化方法的时候,要传入execl文件的路径excel_path,不传是使用一个默认地址,index 是指定execl的哪个sheet,不传默认操作的是第一个sheet
# --coding:utf-8--
# ! python3
import xlrd
from xlutils.copy import copy
import os
import json
import codecs
class ExcelUtil:
def __init__(self, excel_path=None, index=None):
if excel_path == None:
self.excel_path = "E:\\python\\问题列表文档\\execl合并\\results\\result.xlsx"
else:
self.excel_path = excel_path
if index == None:
self.index = 0 # 0 代表第一个sheet
else:
self.index = index
self.data = xlrd.open_workbook(self.excel_path) #将整个execl内容读到self.data里面
self.table = self.data.sheets()[</

文章介绍了如何利用Python的pandas库和自定义的ExcelUtil类来批量合并多个Excel文件,并进行统计分析。通过CombineExcel类可以合并同一目录下的所有Excel文件,而Statistics类则用于对合并后的数据进行项目问题的解决情况和组别问题解决情况的统计。
最低0.47元/天 解锁文章
445

被折叠的 条评论
为什么被折叠?



