使用pandas的groupby函数和agg函数计算每个分组的多个统计指标并自定义计算指标的名称
在数据分析中,我们经常需要对数据进行分组统计,例如求每个月的平均值、中位数、最大值等。pandas提供了很多方便的函数来实现这些操作,其中包括groupby函数和agg函数。
groupby函数可以根据某一列或多列对数据进行分组,然后对每个分组应用某个聚合操作,例如求和、平均值、中位数、最大值等。agg函数则可以对每个分组应用多个聚合操作,并将结果存储为一个数据框。
下面我们使用一个示例数据集来说明如何使用groupby函数和agg函数计算每个分组的多个统计指标并自定义计算指标的名称。
首先,我们需要导入pandas库并读取示例数据集:
import pandas as pd
# 读取数据集
data = pd.read_csv('sales_data.csv')
数据集包含了每位销售员每天的销售额和销售数量
本文介绍了如何利用pandas的groupby和agg函数对数据进行分组统计,包括计算每个分组的平均值、中位数、最大值、最小值等,并展示了如何自定义计算指标的名称。示例中,通过销售员和月份的分组,计算了总销售额、平均销售额、最大和最小销售额,并展示了使用lambda表达式计算75%分位数的方法。
订阅专栏 解锁全文
709

被折叠的 条评论
为什么被折叠?



