《数据分组与聚合操作全解析》
在数据处理和分析中,对数据进行分组和聚合是非常常见且重要的操作。本文将详细介绍如何使用Python中的相关工具进行数据的分组、聚合以及一些高级操作。
1. 基本分组操作
在进行数据分组时,我们可以使用 groupby 方法。例如,对于一个包含 data1 、 data2 、 key1 和 key2 列的DataFrame df ,我们可以按 key1 和 key2 进行分组并计算均值:
import pandas as pd
# 假设df已经定义
df.groupby(['key1', 'key2']).mean()
输出结果如下:
data1 data2
key1 key2
a one 0.880536 1.319920
two 0.478943 0.092908
b one -0.519439 0.281746
two -0.555730 0.769023
需要注意的是,在默认情况下,只有数值列会被聚合。像 df['key2'] 这种非数值列,会被视为“干扰列”,在聚合结果中被排除。
Pandas数据分组与聚合详解
超级会员免费看
订阅专栏 解锁全文
1518

被折叠的 条评论
为什么被折叠?



