Pandas怎样实现groupby分组统计

本文详细介绍了Python的Pandas库如何进行groupby操作,通过实例展示了如何对数据进行分组并进行统计分析,包括求和、平均、计数等方法,帮助读者掌握数据处理的核心技巧。

'''
# 类似SQL:
select city,max(temperature) from city_weather group by city;
groupby:先对数据分组,然后在每个分组上应用聚合函数、转换函数
本次演示:
—、分组使用聚合函数做数据统计
二.遍历groupby的结果理解执行流程
三、实例分组探索天气数据'''
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt #可展示matplot图表
df = pd.DataFrame({"A":['foo','bar','foo','bar','foo','bar','foo','foo'],
                   "B":['one','one','two','three','two','two','one','three'],
                   "C":np.random.randn(8),
                   'D':np.random.randn(8)})
#print(df)
#一、分组使用聚合函数做数据统计
#1、单个列groupby,查询所有数据列的统计
g1 = df.groupby('A').sum()
#2、多个列groupby,查询所有数据列的统计
g2 =df.groupby(['A','B']).sum()
#3、同时查看多种数据统计
g3 = df.groupby('A').agg([np.sum,np.mean,np.std])
#4、查看单列的结果数据统计
#方法1:预过滤,性能更好
g4 = df.groupby('A')['C'].agg([np.sum,np.mean,np.std])
#方法2:
g5 = df.groupby('A').agg([np.sum,np.mean,np.std])['C']
#5、不同列使用不同的聚合函数
g6 = df.groupby('A').agg({'C':np.sum,'D':np.mean})

##二、遍历groupby的结果理解执行流程
#for 循环可以直接遍历每个group
#1.遍历单个列聚合的分组
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值