pandas 的groupby函数

本文详细介绍了Pandas库中GroupBy功能的使用方法,包括如何通过splitting, applying及transform三步骤来完成数据分组处理。文章举例展示了单列与多列分组的方法,并提供了求均值、计数、求和等常见操作的代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

从pandas的说明文档中大概可以理解到:一个完整的 groupby 过程可以包括:splitting, applying, transform 三部分。

groupby() 返回的是一个带划分信息的GroupBY对象,此时没有实施具体的切分等操作(如果后续的apply没有必要的话,会尽可能的不进行修改操作)。

例子:

df.groupby( 'column1' )  将df按照 column1 划分.

df.groupby([ 'column1', 'column2' ])  将df也可以按多个列划分,先按col1 划分,在划分好的子集内再按col2划分。

df.groupby('col1').mean() 均值

df.groupby('col1').size()  每个子集的大小(类似于count())

df.groupby('col1').sum() 加和

df.groupby('col1').sum() [ 'col3' ] 只看col3的情况

df.groupby('col1')
df.groupby('col1')
df.groupby('col1')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值