pandas合并groupby_Pandas GroupBy 用法

最新推荐文章于 2023-07-02 12:24:08 发布

飞翔的袋鼠弟

最新推荐文章于 2023-07-02 12:24:08 发布

阅读量1.4k

点赞数

文章标签： pandas合并groupby

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42451850/article/details/111953153

版权

本文详细介绍了Pandas的GroupBy操作，包括分组、用函数处理和合并三个阶段。通过示例展示了如何根据DataFrame的列进行分组并计算特定列的均值。此外，还讲解了等级分组，即使用多列作为分组键。GroupBy对象是这一过程的核心，允许对每组应用各种函数并合并结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Pandas GroupBy用法，现在，我们来深入分析GoupBy过程及其工作原理，它的操作模式由三个阶段组成：

分组：将数据集分成多个组

用函数处理：用函数处理每一个组

合并：把不同组得到的结果合并起来

第一阶段，也就是分组阶段，根据给定标准，把Series或DataFrame等数据结构中的数据分成不同的组，分组标准常与索引或某一列具体的元素相关。

第二阶段也称为“用函数处理”，使用函数处理或者执行由函数定义的计算，为每组数组生成单一的值。

第三阶段为合并，把来自每一组的结果汇集到一起，合并成一个新对象。

GroupBy 实例

Pandas 并没有使用三个函数来表示这个过程，而只使用了groupby()函数，它生成的GroupBy对象是整个过程的核心。通过如下例子来帮助理解，首先定义一个既包含数值又包含字符串的DataFrame对象。

输出结果如下:

假如想使用Color列的组标签，计算price1列的均值，你可以先获取到price1列，然后调用groupby()函数，参数指定为color列。

输出结果如下:

得到的对象为GroupBy对象，刚进行的操作其实就是分组操作，把含有相同颜色的行分到同一个组中。

可以调用GroupBy对象的group属性，查看DataFrame各行的分组情况，每个组指定好它所包含的行，就可以对每组进行操作获取结果了。

输出结果如下:

等级分组

前面介绍了用一列元素作为键为数据分组，同理，也可以使用多列，也就是使用多个键，按照等级关系分组。如下例所示：

输出结果如下:

我们也可以按照多列数据或整个DataFrame把数据分成几组，如果你不想反复多次使用GroupBy对象，最方便的办法就是一次就把所有的分组依据和计算方法都指定好，无需定义任何中间变量，如下列所示：

输出结果如下:

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。