Pandas聚合操作与案例：探索数据的统计摘要

最新推荐文章于 2025-10-08 02:36:57 发布

代码飞翔

最新推荐文章于 2025-10-08 02:36:57 发布

阅读量111

点赞数

CC 4.0 BY-SA版权

文章标签： pandas Python

本文链接：https://blog.youkuaiyun.com/HackNebulaZ/article/details/133035189

Python 专栏收录该内容

285 篇文章 ¥59.90 ¥99.00

订阅专栏

本文详细介绍了Pandas库中的聚合操作，包括计算平均值、总和、最大值和最小值，以及统计描述。通过实例展示了如何使用mean、sum、max、min和describe函数，以及如何结合groupby和agg进行分组聚合，帮助读者理解如何利用Pandas对数据进行统计分析。

Pandas是一个功能强大的数据分析库，提供了丰富的工具和函数，用于处理和分析结构化数据。其中，聚合操作是数据分析中的重要环节，它允许我们对数据进行分组并计算各组的统计摘要。本文将介绍Pandas中常用的聚合操作，并通过案例演示其用法。

在开始之前，我们首先需要导入Pandas库，并准备一份示例数据。以下是一个简单的学生考试成绩表，包含学生姓名、科目和对应的成绩：

import pandas as pd

data = {
    '姓名': ['张三', '李四', '王五', '赵六', '钱七', '孙八', '周九', '吴十'],
    '科目': ['数学', '数学', '语文', '语文', '英语', '英语', '数学', '语文'],
    '成绩': [80, 90, 85, 95, 70, 75, 88, 92]
}

df = pd.DataFrame(data)

上述代码创建了一个名为df的DataFrame对象，其中包含了学生的考试成绩数据。

现在，让我们来探索一些常用的聚合操作。

计算平均值（mean）

平均值是聚合操作中最基本的一种，它用于计算一组数据的平均数。在Pandas中，我们可以使用mean()函数来实现。下面的代码演示了如何计算学生的数学成绩平均值：

math_mean = df[df['科目'] == '数学']['成绩'].mean()
print("数学成绩平均值：", math_mean)

输出结果为：

了解本专栏