Python自定义分组的两种方式及自定义函数

Python常用的分组方式,一种pivot_table,一种groupby

自定义函数,df_series(x)用来对某一列去重拼接,df_len(x)用来对某一列去重计数,前提目标列必须是字符串。

def df_series(x):
    return ','.join(set(x))
def df_len(x):
    return len(set(x))
pivot_table 方法
pd.pivot_table(data,index='商户名',values=['交易金额','付款方'],aggfunc=[{'商户名':np.sum,'付款方':[df_series,df_len]}])
groupby() 方法
data.groupby(["商户名"])['交易金额','付款方'].agg({'交易金额':np.sum,'付款方':[df_series,df_len]})
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值