15、数据分组聚合、过滤与转换全解析

数据分组聚合、过滤与转换全解析

在数据处理和分析过程中,分组聚合、过滤与转换是非常重要的操作。本文将详细介绍这些操作的方法和技巧,包括多列分组聚合、去除多级索引、自定义聚合函数以及检查分组对象等内容。

多列分组聚合

在进行多列分组时,我们可以将列名列表传递给 groupby 方法。例如,以 AIRLINE WEEKDAY 列进行分组,每个唯一的组合将形成一个独立的组。

# 假设存在 flights 数据集
# 按 AIRLINE 和 WEEKDAY 分组,计算取消航班的总和
flights.groupby(['AIRLINE', 'WEEKDAY'])['CANCELLED'].sum()

我们还可以对多列进行聚合操作,应用不同的聚合函数。

# 按 AIRLINE 和 WEEKDAY 分组,对 DIST 列应用 sum 和 mean 函数,对 ARR_DELAY 列应用 min 和 max 函数
airline_info = flights.groupby(['AIRLINE', 'WEEKDAY']).agg({'DIST':['sum', 'mean'], 'ARR_DELAY':['min', 'max']})

此外,还可以使用字典将特定的聚合列映射到不同的聚合函数。

# 按 AIRL
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值