表格处理实际应用之去重累加汇总
1.使用场景
朋友小k有一个如下表1的数据
他希望将isbn和title相同的数据合并,并累加total,其他列数据不变。
2.实现思路
1).EXCEL直接使用数据透视表功能,但是我不熟总觉的用起来麻烦,略过
2).EXCEL导入mysql数据库,使用sql查询
select *,sum(total) as '总计' from sheet1 group by isbn,title
3).使用duckdb直接读取操作EXCEl,使用是上面的sql查询。ps: sql语句用上面的会报错,需要把*改成anyvalue(isbn),anyvalue(title),anyvaule(price),anyvaule(total)。mysql操作好像是要修改sql_mode那个groupby,duckdb没有找到相关原因分析。
4).pandas的groupby聚合汇总
3.最终实现
ExcelWriter对多sheet表操作写入
参考:
Python中groupby的简单使用