数据分析-Pandas的核心操作groupby简介

本文介绍了Pandas库中groupby功能在数据分析中的关键作用,包括数据分组、聚合、转换和过滤,以及与SQL查询的关联,通过实例演示如何使用groupby对数据进行分类、处理和汇总。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据分析-Pandas的核心操作groupby简介

数据分析和处理中,难免会遇到各种数据,那么数据呈现怎样的规律呢?不管金融数据,风控数据,营销数据等等,莫不如此。如何通过图示展示数据的规律?

数据表,时间序列数据在数据分析建模中很常见,例如天气预报,空气状态监测,股票交易等金融场景。数据分析过程中重新调整,重塑数据表是很重要的技巧,此处选择Titanic数据,以及巴黎、伦敦欧洲城市空气质量监测 N O 2 NO_2 NO2数据作为样例。

数据分析

数据分析-Pandas如何转换产生新列

数据分析-Pandas如何统计数据概况

数据分析-Pandas如何轻松处理时间序列数据

数据分析-Pandas如何选择数据子集

数据分析-Pandas如何重塑数据表-优快云博客

实验数据分析处理,股票序列,时间序列,信号序列,有时候表格的数据需要进行分类,拆分,分组处理,,针对每组进行分类处理,处理后的结果还想汇总起来。这是pandas很常见的使用场景,pandas如何通过groupby,分步骤进行数据分类、处理、汇总呢?

Group by的意义:split-apply-combine

通过“group by”,是包含以下一项或多项的步骤:

  • 拆分:根据某些条件将数据拆分为几组。
  • 应用:对每个组进行独立的函数操作。
  • 合并:将结果合并到一定数据结构中。

其中,拆分步骤的操作就是字面的意思,最直接直白的。

而在应用步骤中,可能希望执行下列操作之一:

  • 聚合:为每个分组计算汇总统计量,统计数据。例如:

    • 计算组总和或均值。
    • 计算组大小/计数。
  • 转换:执行一些特定组的计算,并返回一个 like-indexed 对象。例如:

    • 标准化操作分组的数据 (zscore)。
    • 填充NA值,使用每个组派生计算的值填充组内的 NA。
  • 过滤:筛掉一些分组,根据组为单位计算,筛选条件计算结果为 True 或 False。例如:

    • 丢弃占比低,少数成员的组数据。
    • 根据总和或平均值来筛选分组。

其中许多操作是在 GroupBy 对象上定义的,例如聚合 API窗口 API重采样 API。

也有有这样可能情况,例如给定的操作并没有落入到任何一个分类数据中,或者只是一些分组合并。

在这些情形下,最合适的可能就是使用GroupBy计算。这样的计算会检查应用计算步骤后的结果,并且尽量把这些分组结果合并为一个最后结果,当如果这些并不适合上述的类型数据。

使用内置 GroupBy ,把一个操作拆分为多个步骤,比用户定义的 Python 函数更有效。

当然,GroupBy 这个名字,对于使用过的SQL语言人来说,应该很熟悉,您会常常编写如下代码:

SELECT Column1, Column2, mean(Column3), sum(Column4)
FROM SomeTable
GROUP BY Column1, Column2

我们的目标是通过pandas,让这些操作更加自然,容易表达。后续我们将讨论各个方面的 GroupBy 的功能,同时提供一些样例。

Splitting拆分

分组的抽象定义是提供映射规则把数据映射到分组,标签。创建 GroupBy 对象,您可以执行以下操作:

In [1]: speeds = pd.DataFrame(
   ...:     [
   ...:         ("bird", "Falconiformes", 389.0),
   ...:         ("bird", "Psittaciformes", 24.0),
   ...:         (
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Alex_StarSky

你的鼓励是创作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值