pandas中groupby函数中参数ax_index和group_keys的区别

本文深入探讨了Pandas中groupby函数的as_index与group_keys参数的使用技巧,通过实例对比了不同设置下数据帧的变化,揭示了这些参数如何影响分组后的索引行为。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言:笔者在学习pandas中groupby函数时,发现ax_index=True\False和group_key=True\False这两个参数相近又有所不同,特写出此文供大家分享。

一、首先创建一个DataFrame。

df = pd.DataFrame({'key1':list('aaabbbaabb'),
				'key2':[1,2,2,1,2,1,1,2,1,2,],
				'data1':np.random.randn(10),
				'data2':np.random.randn(10)})

得到df:

在这里插入图片描述

二、group_keys分别在True和False时的影响。

a1 = df.groupby(['key1','key2'],group_keys=True).apply(lambda x:x.iloc[[0,1]]) 
# 匿名函数的作用是选出每组的前两行

得到a1
在这里插入图片描述

a2 = df1.groupby(['key1','key2'],group_keys=False).apply(lambda x:x.iloc[[0,1]])

得到a2
在这里插入图片描述
group_keys=False 可以禁用分组键所形成的索引,不会删去原始对象的索引。

三、as_index分别在True和False时的影响

b1 = df1.groupby(['key1','key2'],as_index=False).apply(lambda x:x.iloc[[0,1]])

得到b1

在这里插入图片描述

b2 = df1.groupby(['key1','key2'],as_index=False).apply(lambda x:x.iloc[[0,1]])

得b2
在这里插入图片描述
ax_index=False 可以禁用分组键作为索引的行为,同时自动给定一个索引。

四、ax_index和group_keys比较

当两者都是False的情况下,相同之处在于:都会禁用分组键。不同之处在于:ax_index在消除分组键的同时会自动生成一个索引。

五、group_keys的特殊情况

当调用聚合函数时,其本身的索引会失效,此时传递group_keys=False无效(与group_keys=True一样)
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值