在用excel处理一些数据时,是否有小伙伴们遇到这样一个问题:只需保留非零数据,以及将多行多列(图一)的数据整理成汇总表的形式(图二)。复制粘贴加上excel筛选等操作可以解决,但是太慢了叭!这里推荐一个超快小技巧,只要下面短短六行代码就可以解决!
import pandas as pd
pop = pd.read_csv('D://Test//未汇总的采购数据.csv',encoding='gbk',index_col='日期')
pop1=pop.stack()#数据集由横向改为纵向,或者为转秩
pop2=pop1[pop1>0]
pop2.index.names = ['日期', '零件']
pop2.to_csv('D://Test//采购数据汇总.csv', header=True, index=True)
图一:原始数据*
图二:结果
温馨提示:进行读取文档的时候,如果是excel形式,会出现时间不正常显示的bug(如下图),转换成csv形式就正常啦!