groupby函数应用

本文通过实例演示了如何使用Python的pandas库中的groupby函数进行数据分组、聚合操作,适合初学者理解其用法。

groupby函数是Python中pandas库中的一个重要函数,用于对数据进行分组。它可以将一个大的数据集划分为更小的组,以便进行聚合、过滤或转换等操作。

为了正清楚groupby 函数,这里举几个简单的小例子,

案例1,对数据进行分组

import pandas as pd 
import numpy as np
#准备数据
df=pd.DataFrame(data={'sex':np.random.randint(0,2,size=300),
                      'class':np.random.randint(1,9,size=300),
                      'python':np.random.randint(0,151,size=300),
                      'keras':np.random.randint(0,151,size=300),
                      'Tensorflow':np.random.randint(0,151,size=300),
                      'java':np.random.randint(0,151,size=300),
                      'c++':np.random.randint(0,151,size=300)
                      })
#设置sex为索引列
df['sex']=df['sex'].map({0:'男', 1:'女'})
#按照sex进行单分组,这里按照sex分组,就会被分层两组
g=df.groupby(by='sex') #单分组

运行结果:

#按照sex 和class进行分组,就会被分成女,8个组,男8个组

g=df.groupby(by=['sex','class'])
for name,data in g:
    print("组名",name)
    print('数据',data)

#输出结果;

#还可进行组合后的计算

#数据求和

g=df.groupby(by=['sex','class'])["python"].sum()

结果:

也可是是计算均值

g=df.groupby(by=['sex','class'])["python"].mean()

通过多次学习,相信对groupby函数会有更多的认识。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值