Pandas中的数据聚合

最新推荐文章于 2025-06-11 15:14:16 发布

kunkun_1230

最新推荐文章于 2025-06-11 15:14:16 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

分类专栏： Pandas 文章标签： groupby merge

本文链接：https://blog.youkuaiyun.com/weixin_44731100/article/details/88957556

Pandas 专栏收录该内容

11 篇文章

订阅专栏

本文介绍了如何使用Pandas的groupby方法进行数据聚合，包括count、sum、mean等操作，并展示了如何将聚合后的结果转换为DataFrame，更新列名，以及通过inner或outer join与原始DataFrame结合的方法。

通过pandas的groupby方法，我们可以获得按组聚类后的各种方法等（count/sum/mean/median/std/var/min/max）

常用的方法为：

sku_tot_vol = data['unuseble_volume'].groupby([data.sku,data.location_code,data.unuseble_volume]).sum()

或者

df.groupby(['warehouse_code', 'storehouse_code','zone_use','packaging_attr','location_code','sku'])['total_quantity'].sum()

需要筛选的字段可前可后

这时候形成的数据形式是：Series。

然鹅，很多时候我们需要把聚合后的结果与原有的DataFrame数据结合，那如何操作呢？

1.将sku_tot_vol转化为DataFrame格式的数据

Sku_tot_vol = pd.DataFrame(sku_tot_vol)

2.更新列名，因为形成的DataFrame数据没有列名

Sku_tot_vol.reset_index(inplace= True)

Sku_tot_vol = Sku_tot_vol.rename(columns={'sku_vol':'unuseble_volume'})

3.将此数据与result数据进行结合。结合的方式可以选择inner或者outer join，连接的主键在on中说明，这个写法和SQL类似

Sku_tot_vol = Sku_tot_vol.rename(columns={'sku_vol':'unuseble_volume'})

result = pd.merge(result,Sku_tot_vol,on =['location_code','warehouse_code','storehouse_code','zone_use'],how='left')

以上，数据聚合就完成了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kunkun_1230

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Pandas中的数据聚合方法

KJ.JK

11-24

6857

数据聚合，一般都是指对分组中的数据执行某些操作，比如求平均值、求最大值等，并且操作后得到一个结果集，这些实现聚合的操作称为聚合方法。Pandas中提供了用做聚合操作的agg()方法。一、使用内置统计方法聚合数据前面已经介绍过Pandas的统计方法，比如用于获取最大值和最小值的max()和min()，这些方法常用于简单地聚合分组中的数据。假设现在我们

Python数据分析NumPy和pandas（三十一、数据聚合）

FreedomLeo1的博客

11-13

1303

聚合是指从数组生成标量值的数据转换。常见的聚合见下图列表，但是，不仅限于列表中的这组方法。通过使用 DataFrame，我们可以指定要应用于所有列的函数列表或每个列的不同函数。在到目前为止的所有示例中，聚合数据都返回了一个索引，该索引可能是分层的，由唯一的组键组合而成。当然，通过对结果调用 reset_index 方法也可以实现去除索引，但是会需要一些计算，因此在分组的时候使用 as_index=False 参数可避免一些不必要的计算。可以使用自己的设计的聚合方法，也可以调用分组的对象上定义的任何方法。

参与评论您还未登录，请先登录后发表或查看评论

Pandas `DataFrame` 数据汇总与聚合

AI Agent 首席体验官

02-15

1212

您可以使用agg()方法定义自定义聚合函数。您可以将字典传递给agg()，以对不同的列应用不同的聚合函数。如果需要更复杂的聚合计算，可以使用自定义函数。# 使用自定义聚合函数计算销量波动范围ProductA 50B 30C 60通过以上示例，我们展示了 Pandas 中如何进行数据汇总与聚合。使用groupby()对数据进行分组。使用agg()方法进行多重聚合。使用创建透视表。使用和apply()进行更复杂的行级操作。使用自定义函数进行定制化的聚合。

pandas数据处理（三）---数据合并、聚合

weixin_43165676的博客

12-21

2181

数据合并、拼接 Pandas包的merge、join、concat方法可以完成数据的合并和拼接，merge方法主要基于两个dataframe的共同列进行合并，join方法主要基于两个dataframe的索引进行合并，concat方法是对series或dataframe进行行拼接或列拼接。一、数据合并 1、merge pandas的merge方法是基于共同列，将两个dataframe连接起来。merge方法的主要参数： pd.merge(left,right,how="inner", on=None,le

使用 Pandas 进行数据聚合与操作：从合并到可视化的全面指南

最新发布

静水深流

06-11

520

Pandas数据处理与可视化技术摘要 Pandas作为Python核心数据分析库，提供了强大的数据处理功能。本文介绍了其关键技术应用：通过pd.merge()实现多源数据关联，支持各种连接方式；基于布尔条件的高效数据筛选方法；利用向量化运算创建新数据列；结合Matplotlib的可视化功能。这些技术构成了从数据清洗、转换到分析展示的完整工作流，显著提升数据分析效率，为业务决策提供可靠支持。150字

【python】Pandas 数据分析之分组聚合操作|代码讲解|建议在Jupyter Notebook 中运行

weixin_57336987的博客

09-21

750

建议在Jupyter Notebook 中运行。

Pandas数据分组聚合

rexyang97的博客

06-05

470

合并数据表 pandas提供join操作进行数据间的快速合并，默认以行索引对其 def join(self, other, on=None, how="left", lsuffix="", rsuffix="", sort=False)

【Python数据分析】Pandas_聚合函数

qq_45951891的博客

06-18

515

可以与聚合函数一起使用，聚合函数指的是对一组数据求总和、最大值、最小值以及平均值的操作，本节重点讲解聚合函数的应用。首先让我们创建一个 DataFrame 对象，然后对聚合函数进行应用。

Pandas使用教程 - 数据分组与聚合 (groupby)

qq_42568323的博客

02-12

1722

除了使用内置的聚合函数外，我们还可以传入自定义函数来对每个组的数据进行处理。假设我们想计算每个部门工资的极差（最大值减去最小值），可以自定义一个 lambda 表达式或函数来实现。我们也可以定义一个函数，并传入agg()方法。salary_range_func = df.groupby("部门")["工资"].agg(calc_range)print("各部门工资极差（自定义函数）：")输出与上例相同。

79 | Python数据分析篇 —— Pandas中groupby聚合操作和透视表基础

微信号：RunsenLiu

08-06

891

'C' : my_mean }) print(mean) # 输出 # C # A # bar 2.0 # foo 4.0本文介绍了Pandas中groupby聚合操作和透视表的基础知识，包括groupby操作、透视表的创建和使用。groupby操作可以将数据按照指定的列进行分组，并对每组数据进行聚合计算，常用的聚合函数包括count、sum、mean、median、min、max等。透视表是一种数据汇总工具，它可以将数据按照指定的列进行分组，并对每组数据进行聚合计算。

pandas数据聚合与分组运算

CarveStone的博客

01-18

792

在本章中你将会看到，由于Python和pandas强大的表达能力，我们可以执行复杂得多的分组运算（利用任何可以接受pandas对象或NumPy数组的函数）。任何被当做分组键的函数都会在各个索引值上被调用一次，其返回值就会被用作分组名称。在Pandas中，分组是指使用特定的条件将原数据划分为多个组，聚合在这里指的是，对每个分组中的数据执行某些操作，最后将计算的结果进行整合。将函数作为分组键会更加灵活，任何一个被当做分组键的函数都会在各个索引值上被调用一次，返回的值会被用作分组名称。

【Pandas】groupby 分组聚合操作

qq_41934715的博客

06-01

3450

Pandas库里的groupby首先按照 key 进行分组，就可以得到每个 groupby 的名称，以及 group 本身；group本身是一个dataframe或者一个series；再在这个dataframe或者series基础上进行统计。统计完成之后会将key和统计结果拼合起来。

pandas常用的聚合操作

weixin_48232453的博客

09-02

664

功能：可以在agg中使用自定义的函数，进行更复杂的聚合计算。用法：在agg中定义函数。# 使用自定义函数计算每个电厂的温度范围（最大值 - 最小值）powerplantA 2B 2。

Pandas聚合运算和分组运算的实现示例

lamehd的博客

10-18

350

这篇文章主要介绍了Pandas聚合运算和分组运算的实现示例，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们可以参考一下： 1.聚合运算 (1)使用内置的聚合运算函数进行计算 1>内置的聚合运算函数 sum(),mean(),max(),min(),size(),describe()...等等 2>应用聚合运算函数进行计算 impo...

【Pandas-Cookbook】04：分组、聚集

墨竹

02-16

878

# -*-coding:utf-8-*-# --------------------- # Chapter 4: Find out on which weekday people bike the most with groupby and aggregate # ---------------------import pandas as pd import matplotlib.pyplot as

pandas如何多行变一行(对文本进行拼接和聚合)?

theskylife的博客

06-29

2776

pandas如何对文本类数据进行如何，如何将一行变为多行

Pandas_聚合数据_crosstab()_2

学习笔记

11-21

1189

pd.crosstab() 用于计算分组的频率，算是一种特殊的pivot_table() 是顶级类函数 pandas.crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, margins_name='All', dropna=True, normaliz...

pandas数据加载,聚合和分组计算

weixin_38605146的博客

08-08

624

数据加载 1. 读取文本格式的文件 pandas中的解析函数: read_csv———-从文件,URL,文件型对象中加载带分隔符的数据.默认分隔符为逗号 read_table——–从文件,URL,文件型对象中加载带分隔符的数据.默认分隔符为制表符(‘\t’) read_fwf———–读取定宽列格式数据(也就是说没有分隔符) read_clipboard———–读取剪切板中的数据,可以...

【Pandas分组聚合】进阶：使用自定义函数方法 transform() 、apply()

weixin_45760274的博客

03-15

3695

【Pandas】使用自定义方法 dataframe() apply()

掌握Pandas在数据分析中的应用

资源摘要信息: "Pandas数据分析代码" 1. 概述 Pandas 是一个强大的 Python 数据分析工具库，它提供了高性能、易于使用的数据结构和数据分析工具。Pandas 的核心数据结构是 DataFrame，它是一个二维标签化数据结构，...