Pandas是一个功能强大的数据分析库,提供了丰富的工具和函数,用于处理和分析结构化数据。其中,聚合操作是数据分析中的重要环节,它允许我们对数据进行分组并计算各组的统计摘要。本文将介绍Pandas中常用的聚合操作,并通过案例演示其用法。
在开始之前,我们首先需要导入Pandas库,并准备一份示例数据。以下是一个简单的学生考试成绩表,包含学生姓名、科目和对应的成绩:
import pandas as pd
data = {
'姓名': ['张三', '李四', '王五', '赵六', '钱七', '孙八', '周九', '吴十'],
'科目': ['数学', '数学', '语文', '语文', '英语', '英语', '数学', '语文'],
'成绩': [80, 90, 85, 95, 70, 75, 88, 92]
}
df = pd.DataFrame(data)
上述代码创建了一个名为df的DataFrame对象,其中包含了学生的考试成绩数据。
现在,让我们来探索一些常用的聚合操作。
- 计算平均值(mean)
平均值是聚合操作中最基本的一种,它用于计算一组数据的平均数。在Pandas中,我们可以使用mean()函数来实现。下面的代码演示了如何计算学生的数学成绩平均值:
math_mean = df[df['科目'] == '数学']['成绩'].mean()
print("数学成绩平均值:", math_mean)
输出结果为:
本文详细介绍了Pandas库中的聚合操作,包括计算平均值、总和、最大值和最小值,以及统计描述。通过实例展示了如何使用mean、sum、max、min和describe函数,以及如何结合groupby和agg进行分组聚合,帮助读者理解如何利用Pandas对数据进行统计分析。
订阅专栏 解锁全文
67

被折叠的 条评论
为什么被折叠?



