'''
# 类似SQL:
select city,max(temperature) from city_weather group by city;
groupby:先对数据分组,然后在每个分组上应用聚合函数、转换函数
本次演示:
—、分组使用聚合函数做数据统计
二.遍历groupby的结果理解执行流程
三、实例分组探索天气数据'''
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt #可展示matplot图表
df = pd.DataFrame({"A":['foo','bar','foo','bar','foo','bar','foo','foo'],
"B":['one','one','two','three','two','two','one','three'],
"C":np.random.randn(8),
'D':np.random.randn(8)})
#print(df)
#一、分组使用聚合函数做数据统计
#1、单个列groupby,查询所有数据列的统计
g1 = df.groupby('A').sum()
#2、多个列groupby,查询所有数据列的统计
g2 =df.groupby(['A','B']).sum()
#3、同时查看多种数据统计
g3 = df.groupby('A').agg([np.sum,np.mean,np.std])
#4、查看单列的结果数据统计
#方法1:预过滤,性能更好
g4 = df.groupby('A')['C'].agg([np.sum,np.mean,np.std])
#方法2:
g5 = df.groupby('A').agg([np.sum,np.mean,np.std])['C']
#5、不同列使用不同的聚合函数
g6 = df.groupby('A').agg({'C':np.sum,'D':np.mean})
##二、遍历groupby的结果理解执行流程
#for 循环可以直接遍历每个group
#1.遍历单个列聚合的分组
Pandas怎样实现groupby分组统计
最新推荐文章于 2024-06-18 09:14:16 发布
本文详细介绍了Python的Pandas库如何进行groupby操作,通过实例展示了如何对数据进行分组并进行统计分析,包括求和、平均、计数等方法,帮助读者掌握数据处理的核心技巧。

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



