在用excel处理一些数据时,是否有小伙伴们遇到这样一个问题:只需保留非零数据,以及将多行多列(图一)的数据整理成汇总表的形式(图二)。复制粘贴加上excel筛选等操作可以解决,但是太慢了叭!这里推荐一个超快小技巧,只要下面短短六行代码就可以解决!
import pandas as pd
pop = pd.read_csv('D://Test//未汇总的采购数据.csv',encoding='gbk',index_col='日期')
pop1=pop.stack()#数据集由横向改为纵向,或者为转秩
pop2=pop1[pop1>0]
pop2.index.names = ['日期', '零件']
pop2.to_csv('D://Test//采购数据汇总.csv', header=True, index=True)
图一:原始数据
*
图二:结果

温馨提示:进行读取文档的时候,如果是excel形式,会出现时间不正常显示的bug(如下图),转换成csv形式就正常啦!

使用Python的pandas库,仅六行代码即可实现Excel数据中非零值的快速筛选与汇总,将多行多列数据整理成汇总表,提高数据处理效率。

被折叠的 条评论
为什么被折叠?



