Python Pandas分组函数案例详解

原创

已于 2024-01-17 15:10:51 修改 · 1.1k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#python #pandas #开发语言

于 2024-01-17 15:10:39 首次发布

Pandas的groupby函数是数据分析和处理中的重要工具，允许按照指定的列对数据进行分组，并在每个组内执行相应的操作。本文将详细介绍groupby函数的使用方法，并提供丰富的示例代码，覆盖从基础用法到高级操作的多个方面。

1. 基础用法

1.1 分组并计算统计量

import pandas as pd

# 创建示例DataFrame
data = {'Category': ['A', 'B', 'A', 'B', 'A', 'B'],
        'Value': [10, 20, 15, 25, 18, 30]}
df = pd.DataFrame(data)

# 按Category分组，并计算每组的平均值
grouped = df.groupby('Category')
result = grouped.mean()

print(result)

1.2 多列分组

# 多列分组，并计算每组的总和
result_multi = df.groupby(['Category', 'Value']).sum()

print(result_multi)

2. 聚合函数和变换

2.1 自定义聚合函数

# 自定义聚合函数
def custom_agg(x):
    return x.max() - x.min()

# 应用自定义聚合函数
result_custom_agg = df.groupby('Category')['Value'].agg(custom_agg)

print(result_custom_agg)

2.2 变换操作

# 对每个组进行变换操作，计算与均值的差值
df['Value_diff'] = df.groupby('Category')['Value'].transform(lambda x: x - x.mean())

print(df)

3. 过滤操作

# 过滤出平均值大于15的组
result_filter = df.groupby('Category').filter(lambda x: x['Value'].mean() > 15)

print(result_filter)

4. 高级操作

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Python_P叔

关注关注

22
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Pandas groupby 自定义聚合函数

chaoqichaoluoe的博客

02-08

2406

# 自定义聚合函数， # n.i.o 出现次数0 -> 0 # n.i.o 出现次数1 -> 进一步判断 # n.i.o 出现次数大于2 -> 2 # 此函数需进一步扩展,出现次数大于2的，需要根据计划频率，判断是否在一次连续测试内 def peak_peak(arr,df): # 判断arr的series值中是否包含'n.i.o' x = list(arr).count('n.i.O.') # 只包含一个，条件放行 if x == 1: r

深入理解Pandas的groupby函数

最新发布

yuanyuan___的博客

09-28

451

groupby

python中groupby函数

biggolden1的博客

10-15

3107

上面的例子里面用到了一个小的技巧，让运算结果更便于对比查看，感兴趣的同学可以自行去除unstack，比较一下显示的效果。为A 新增一列【生日】，由于分隔符 “/” 的问题，我们查看列属性，【生日】的属性并不是日期类型。python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算！单独用groupby，我们得到的还是一个 Groupby 对象。得到的结果是一个Groupby对象，还没有进行任何的运算。1、按照【生日】的【年份】进行分组，看看有多少人是同龄？

pandas 自定义groupby的函数

呆萌的代Ma

11-30

1194

示例 import pandas as pd def print_df(dataframe: pd.DataFrame): print("=================") print(dataframe) if __name__ == '__main__': df = pd.DataFrame([ [0, 1, 1], [0, 1, 1], [0, 2, 2], [0, 2, 3] ], colum

Python中Pandas常用函数及案例详解

qq_38519364的博客

03-13

2350

5、df.append() 功能：将另一个DataFrame添加到当前DataFrame的末尾。7、df.sort_values() 功能：根据一个或多个列的值对DataFrame进行排序。9、df.merge() 功能：按照指定的键（key）或者索引来合并两个DataFrame。2、pandas.DataFrame() 功能：创建一个DataFrame。3、df.loc 功能：基于行标签和列名来获取DataFrame的子集。10、df.corr() 功能：计算DataFrame中各列的相关系数。

Python Pandas数据分组详解与实战应用

在Python数据分析领域，Pandas库提供了强大的数据处理能力，尤其是在数据分组操作上。本文档着重探讨了如何使用Pandas的groupby方法进行数据分组和处理，这对于后续的数据分析和可视化至关重要。首先，我们了解到...

Python Pandas.factorize函数解析与实战教程

皓月照山川的博客

08-03

1162

将繁杂的类别数据一键转化为机器学习模型钟爱的“数值金矿”，本教程将通过丰富的实例和深度解析，带你掌握 pandas.factorize

pandas之groupby函数

TSzero的博客

04-04

1万+

sql中的分组语句group by很重要，pandas中也有类似的分组函数，即groupby，本文就主要介绍下它的用法。

Pandas groupby apply 自定义apply

weixin_37763484的博客

11-20

1835

这篇文章介绍了自定义apply函数和groupby的联合用法。 pandas中，groupby和apply一起使用，会减少很多操作。被groupby后的数据是一组一组的DataFrame，这些Frame会被apply函数处理。apply函数能够返回单一值、Series和DataFrame。这些返回结果能够被拼接成Series或者DataFrame，你只需要自定义一个合适的函数f并把它传给a...

Pandas groupby apply agg 区别运行自定义函数

weixin_34060299的博客

02-04

363

agg 方法将一个函数使用在一个数列上，然后返回一个标量的值。也就是说agg每次传入的是一列数据，对其聚合后返回标量。对一列使用三个函数：对不同列使用不同函数 apply 是一个更一般化的方法：将一个数据分拆-应用-汇总。而apply会将当前分组后的数据一起传入，可以返回多维数据。图片来自实例： 1、数据如下： lawsuit2[['EI...

详解python pandas库中的groupby函数

2301_79939181的博客

10-02

2732

这里详细介绍了groupby这一分组函数的应用以及是什么,happycodingeveryday

pandas——groupby操作

阿极的博客

02-12

1万+

在数据分析中，我们往往需要在将数据拆分，在每一个特定的组里进行运算。as_index：在groupby中使用的键是否成为新的dataframe中的索引，默认as_index=True。sort：对groupby分组后新的dataframe中索引进行排序，sort=True为升序，我们通过一个或者多个分类变量将数据拆分，然后分别在拆分以后的数据上进行需要的计算。squeeze ：如果可能的话，减少返回类型的维数，否则返回一个一致的类型。pandas中的groupby提供了一个高效的数据的分组运算。

pandas中groupby函数的使用

2301_81245389的博客

03-07

819

groupby()是 Pandas 中用于分组数据的函数，它允许你根据指定的列对数据进行分组，然后对每个分组应用聚合函数。以下是一些groupby()

【Python】进阶学习：pandas--groupby()用法详解

创作高质量博文，分享知识，共同进步！

03-03

4475

🔥深入掌握pandas的groupby()！🚀 从基础到高级，一文读懂groupby的魔法！💡探索聚合运算、数据转换、过滤数据等高级用法，让你的数据处理更高效！🛠️更有实际案例应用，手把手教你如何运用groupby解决实际问题！💪最后，总结精华，助你轻松掌握groupby()的核心要点！#pandas #groupby #数据处理 #进阶学习 #数据分析

Python自定义分组的两种方式及自定义函数

qq_32834123的博客

03-15

1341

Python常用的分组方式，一种pivot_table,一种groupby 自定义函数，df_series(x)用来对某一列去重拼接，df_len（x）用来对某一列去重计数，前提目标列必须是字符串。 def df_series(x): return ','.join(set(x)) def df_len(x): return len(set(x)) pivot_table 方法 pd.pivot_table(data,index='商户名',values=['交易金额','付款方'],ag

Python数据分析入门10（数据分组和透视表）

qq_45144479的博客

07-27

1106

为了接下来对分组结果进行进一步处理与分析，我们需要把非标准形式转化为标准的 DataFrame 形式，利用的方法就是重置索引reset_index()方法。直接运行groupby()方法返回的是DataframeGroupby对象而不是Dataframe，这个对象里面包含着分组以后的若干组数据，但是没有直接显示出来，需要对这些分组数据进行汇总计算以后才会展示出来。分组后默认对所有数据进行聚合运算，若只需要对某些列进行运算，可通过索引的方式取出来，然后对取出来的数据上进行聚合运算。