数据分组聚合、过滤与转换全解析
在数据处理和分析中,分组聚合、过滤与转换是非常重要的操作。下面将详细介绍相关的操作方法和技巧。
多列分组聚合
在进行多列分组时,我们可以将列名列表传递给 groupby 方法。例如,以 AIRLINE 和 WEEKDAY 列进行分组,每个唯一的 AIRLINE 和 WEEKDAY 组合会形成一个独立的组。在每个组内,可以对 cancelled 航班进行求和操作,并以 Series 形式返回结果。
# 假设存在一个DataFrame df,包含AIRLINE、WEEKDAY和cancelled列
# 多列分组并对cancelled列求和
result = df.groupby(['AIRLINE', 'WEEKDAY'])['cancelled'].sum()
我们还可以对多列进行聚合操作,应用不同的聚合函数。例如,对 DIST 列应用 sum 和 mean 函数,对 ARR_DELAY 列应用 min 和 max 函数。
# 多列分组并应用不同聚合函数
airline_info = df
超级会员免费看
订阅专栏 解锁全文
1063

被折叠的 条评论
为什么被折叠?



