数据分组聚合、过滤与转换全解析
1. 多列分组聚合操作
在进行数据处理时,多列分组聚合是一项非常实用的技能。以下是具体的操作步骤和示例:
- 步骤1:多列分组并聚合单一列
我们可以通过将列名列表传递给 groupby 方法,按多列进行分组。例如,按 AIRLINE 和 WEEKDAY 分组,计算每组中取消航班的总和:
# 假设存在一个DataFrame df
df.groupby(['AIRLINE', 'WEEKDAY'])['CANCELLED'].sum()
这里每个`AIRLINE`和`WEEKDAY`的唯一组合形成一个独立的组,然后对每组内的取消航班数量求和并以`Series`形式返回。
- 步骤2:多列分组并聚合多列
同样按AIRLINE和WEEKDAY分组,但这次对两列进行聚合操作,应用sum和mean两个聚合函数:
df.groupby(['AIRLINE', 'WEEKDAY']).agg({'DIST': ['sum', 'mean'], 'ARR_DELAY': ['sum', 'mean']})
超级会员免费看
订阅专栏 解锁全文
1063

被折叠的 条评论
为什么被折叠?



