数据分组聚合、过滤与转换全解析
在数据处理和分析过程中,分组聚合、过滤与转换是非常重要的操作。本文将详细介绍这些操作的方法和技巧,包括多列分组聚合、去除多级索引、自定义聚合函数以及检查分组对象等内容。
多列分组聚合
在进行多列分组时,我们可以将列名列表传递给 groupby 方法。例如,以 AIRLINE 和 WEEKDAY 列进行分组,每个唯一的组合将形成一个独立的组。
# 假设存在 flights 数据集
# 按 AIRLINE 和 WEEKDAY 分组,计算取消航班的总和
flights.groupby(['AIRLINE', 'WEEKDAY'])['CANCELLED'].sum()
我们还可以对多列进行聚合操作,应用不同的聚合函数。
# 按 AIRLINE 和 WEEKDAY 分组,对 DIST 列应用 sum 和 mean 函数,对 ARR_DELAY 列应用 min 和 max 函数
airline_info = flights.groupby(['AIRLINE', 'WEEKDAY']).agg({'DIST':['sum', 'mean'], 'ARR_DELAY':['min', 'max']})
此外,还可以使用字典将特定的聚合列映射到不同的聚合函数。
# 按 AIRL
超级会员免费看
订阅专栏 解锁全文
1066

被折叠的 条评论
为什么被折叠?



