使用Pandas的groupby函数和describe函数进行不同分组的描述性统计

最新推荐文章于 2025-05-21 10:14:25 发布

追逐程序梦想者

最新推荐文章于 2025-05-21 10:14:25 发布

阅读量469

点赞数 1

CC 4.0 BY-SA版权

文章标签： pandas python 开发语言

本文链接：https://blog.youkuaiyun.com/ai52learn/article/details/130854339

Python基础及其应用专栏收录该内容

605 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍了如何使用Pandas的groupby和describe函数对数据集进行分组并计算描述性统计量，如均值、标准差、最小值、最大值等。通过示例展示了对性别分组后的数据进行统计分析，以及如何自定义计算方法进行更复杂的数据处理。

使用Pandas的groupby函数和describe函数进行不同分组的描述性统计

在数据分析过程中，我们经常需要对数据集中不同分组的数据进行描述性统计，比如计算每个分组的均值、标准差、最小值、最大值等。这个时候我们可以使用Pandas库中的groupby函数和describe函数进行计算。

首先，我们先导入Pandas库并读取一个示例数据集：

import pandas as pd

# 读取数据集
df = pd.read_csv('example.csv')

数据集中包含三列数据，分别是姓名（name）、性别（gender）和成绩（score）。现在我们要对数据集按照性别进行分组，并计算每个分组的描述性统计量。

# 按性别分组并计算描述性统计量
grouped

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

追逐程序梦想者

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

详解python中groupby函数通俗易懂

09-16

在Python的Pandas库中，`groupby()`函数是一个非常重要的功能，用于对DataFrame对象进行分组操作。本文将深入探讨`groupby()`函数的使用方法，帮助读者理解其核心概念，并通过实例来展示如何应用它进行数据处理。 1...

pandas使用groupby函数和describe函数计算不同分组的描述性统计（descriptive statistics of each group in dataframe）

data+scenario+science+insight

02-04

6140

pandas使用groupby函数和describe函数计算不同分组的描述性统计（descriptive statistics of each group in dataframe）

参与评论您还未登录，请先登录后发表或查看评论

第四章. Pandas进阶—数据分组统计

weixin_45116749的博客

11-17

2115

第四章. Pandas进阶—数据分组统计

Pandas中groupby+agg+merge及describe实现各类分组统计及一些实用技巧

小白白的博客

07-12

9520

（作者：陈玓玏）在SQL中，我们可以用分析函数轻松实现变量分组后的组内max、min等结果的统计，而在Python中，使用pandas来实现这些功能也是非常简单的。 pandas中也有groupby函数，能够根据特定的列将所有数据进行分组，并通过agg方法对选定的列进行分组统计，内置的统计方法有max、min、mean、var、count等，还能通过lambda或者def自定义匿名函数或者函...

16.Pandas实现groupBy分组统计

优快云专家-微编程的博客

08-15

858

类似Sql:groupby:先对数据分组，然后在每个分组上应用聚合函数，转换函数本次演示分组使用聚合函数做数据统计遍历groupby的结果理解执行流程实例分组探索天气数据。

pandas数据处理---聚合操作[describe]排序[take]数据分类聚合[Series.groupby]高级数据聚合[DataFrame.groupby]

直心I

01-10

1245

4.使用聚合操作对数据异常值检测和过滤 4.1:describe A.使用函数：DataFrame.describe（self，percentiles = None，include = None，exclude = None ） B.参数解析： C.实战： C1.官方例子 C2. E.小节练习 5.排序 A.使用函数：DataFrame.take（self，index，axis = 0，is_...

Pandas分组函数groupby、聚合函数agg和转换函数transform

小龙在线

10-28

1231

by: 指定根据哪个/哪些字段分组，默认值是None，按多个字段分组时传入列表。by参数可以按位置参数的方式传入。axis: 设置按列分组还是按行分组，0或index表示按列分组，1或columns表示按行分组，默认值为0。level: 当DataFrame的索引为多重索引时，level参数指定用于分组的索引，可以传入多重索引中索引的下标（0,1…）或索引名，多个用列表传入。

Pandas数据分析⑤——数据分组与函数使用（Groupby/Agg/Apply/mean/sum/count)

cindy407的博客

06-10

1万+

之前有篇SQL聚合函数的文章（https://blog.youkuaiyun.com/cindy407/article/details/90341410），讲述了SQL中分组函数groupby及相应的聚合函数使用。在Pandas数据分析中，Groupby也是使用频率非常高的方法，两者其实非常相似，看完本篇你就知道怎么用啦！一、Groupby基本使用 ① groupby可以通过传入需要分组的参数实现对数据的...

【python】pandas使用-分组处理操作_groupby

rikoukai的博客

11-12

1840

import pandas as pd pd.set_option('expand_frame_repr', False) # 当列太多时显示完整 # =====导入数据 df = pd.read_csv( r'C:\Users\Simons\Desktop\xbx_stock_2019\data\a_stock_201903.csv', encoding='gbk', skiprows=1 ) # print(df) # ===== groupby常用操作汇总 # 根据.

Pandas GroupBy 深度总结

小詹学python的博客

08-22

346

今天，我们将探讨如何在 Python 的 Pandas 库中创建 GroupBy 对象以及该对象的工作原理。我们将详细了解分组过程的每个步骤，可以将哪些方法应用于 GroupBy 对象上，以及我们可以从中提取哪些有用信息不要再观望了，一起学起来吧使用 Groupby 三个步骤首先我们要知道，任何 groupby 过程都涉及以下 3 个步骤的某种组合：根据定义的标准将原始对象分成组对每个组应用某些函...

Pandas的学习之——使用Pandas进行描述性统计

HunGRy_FOOliSHhh的博客

02-09

7948

首先引入需要的库 import numpy as np import pandas as pd import matplotlib.pyplot as pyplot 读取数据 ratings_url = 'https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBMDeveloperSkillsNetwork-ST0151EN-SkillsNetwork/labs/teachingratings.csv' rating.

python pandas常用统计函数总结 -- 以及与groupby, pivot_table, describe, crossTab等方法结合使用的比较

weixin_45914452的博客

03-27

5863

python pandas中聚合函数的应用小结 1、常用的统计值相对应的python函数平均数：np.mean() 总和：np.sum() 最大值：np.max() 最小值：np.min() 方差：np.var() 标准差：np.std() 频次（计数）: np.count() 中位数：np.median() 协方差： np.cov(x, y) 四分位数：describe() – 显示25%, 50%, 75%位置上的数据 2、基本使用方法 – NumPy包计算 3、数据表中的应用 – groupby

59_Pandas中使用describe获取每列的汇总统计信息（平均值、标准差等）

qq_18351157的博客

04-10

1万+

使用 pandas.DataFrame 和 pandas.Series 的 describe() 方法，您可以获得汇总统计信息，例如每列的均值、标准差、最大值、最小值和众数。在此，对以下内容进行说明。示例代码中，以每列具有不同类型 dtype 的 pandas.DataFrame 为例。

【Pandas总结】第九节 Pandas_累计与分组 pd.groupby()

weixin_47139649的博客

10-02

5497

一、数据准备二、累计值计算 2.1 df.describe() 2.2 常用统计值三、分组 pd.groupby() 四、更多的使用方法`aggregate()`,`filter()`,`transform()`,`apply()` 4.1 `aggregate()` 4.2 `filter()` 4.3 `transform()` 4.4 `apply()`

df.groupby()方法讲解

HTDiiii的博客

09-22

1万+

一些关于groupby的常用方法，代码，忘记的时候翻一翻

Pandas GroupBy：从入门到精通，数据聚合原来可以这么简单有趣

热门推荐

IT之旅的博客

12-28

15万+

Pandas中describe()函数的使用介绍一、describe()函数介绍 pandas 是基于numpy构建的含有更高级数据结构和工具的数据分析包，提供了高效地操作大型数据集所需的工具。pandas有两个核心数据结构 Series和Data...

pandas分组统计函数

03-17

### pandas `groupby` 和统计函数的使用在数据分析领域，Pandas 提供了强大的工具来处理结构化数据。其中，`groupby` 是一种核心功能，能够帮助用户按照特定条件对数据进行分组并执行各种聚合操作。 #### 基本概念 `groupby` 方法的核心思想是对 DataFrame 或 Series 的数据按某个或某些键进行分组，并针对每组应用某种聚合逻辑[^2]。常见的聚合操作包括但不限于均值 (`mean`)、总和 (`sum`)、计数 (`count`)、最大值/最小值 (`max`, `min`) 等。以下是具体的实现方式： --- #### 示例代码展示假设有一个如下所示的数据集： | Group | Value | |-------|-------| | A | 10 | | B | 20 | | A | 30 | | B | 40 | 可以通过以下方式进行分组统计： ```python import pandas as pd # 创建示例数据 data = {'Group': ['A', 'B', 'A', 'B'], 'Value': [10, 20, 30, 40]} df = pd.DataFrame(data) # 使用 groupby 进行分组并计算均值 result_mean = df.groupby('Group').mean() print(result_mean) ``` 上述代码会输出每个组的平均值： ``` Value Group A 20 B 30 ``` 如果需要其他统计量，则可以替换 `.mean()` 为不同的方法，例如 `.sum()` 计算总和[^4]。 --- #### 多种统计量组合当希望一次性获取多种统计量时，可利用 `agg` 方法自定义多个聚合函数： ```python # 自定义多统计量 result_agg = df.groupby('Group').agg(['mean', 'sum', 'min', 'max']) print(result_agg) ``` 这将返回一个包含均值、总计、最小值和最大值的结果表。 --- #### 描述性统计对于更全面的描述性统计分析，可以直接调用 `describe` 方法，该方法会对每一组提供详细的统计数据摘要[^1]。 ```python # 对分组后的数据进行描述性统计 result_describe = df.groupby('Group')['Value'].describe() print(result_describe) ``` 此命令生成的内容通常包括样本数量、均值、标准差以及四分位数值等信息。 --- #### 高级用法：自定义聚合函数除了内置的标准统计函数外，还可以通过传递 lambda 表达式或其他 Python 函数来自定义复杂的聚合逻辑[^3]。 ```python # 定义复杂聚合规则 custom_result = df.groupby('Group').agg(custom_stat=('Value', lambda x: (x.max() - x.min()) / x.mean())) print(custom_result) ``` 这里展示了如何创建一个新的字段 `custom_stat` 来表示范围变化相对于均值的比例关系。 --- ### 总结通过对 Pandas 中 `groupby` 及其关联统计函数的学习，可以高效完成基于类别变量的各种汇总运算任务。无论是基础还是高级需求，这些技术都提供了灵活而强大的支持。