Pandas GroupBy对象 索引与迭代

import pandas as pd
df = pd.DataFrame({'性别' : ['男', '女', '男', '女',
                              '男', '女', '男', '男'],
                       '成绩' : ['优秀', '优秀', '及格', '差',
                              '及格', '及格', '优秀', '差'],
                       '年龄' : [15,14,15,12,13,14,15,16]})
GroupBy=df.groupby("性别")
  1. GroupBy.iter()
    GroupBy对象是一个迭代对象,每次迭代结果是一个元组,元组的第一个元素是该组的名称(就是groupby的列的元素名称),第二个元素是该组的具体信息,是一个数据框,索引是以前的数据框的总索引
for name,group in GroupBy:
    print(name)
    print(group)
女
   年龄 性别  成绩
1  14  女  优秀
3  12  女   差
5  14  女  及格
男
   年龄 性别  成绩
0  15  男  优秀
2  15  男  及格
4  13  男  及格
6  15  男  优秀
7  16  男   差
  1. GroupBy.groups
    显示分组的组名,以及所对应的索引
print(GroupBy.groups)
{'女': Int64Index([1, 3, 5], dtype='int64'), '男': Int64Index([0, 2, 4, 6, 7], dtype='int64')}
  1. GroupBy.indices
    类似于GroupBy.groups
print(GroupBy.indices)
{'女': array([1, 3, 5], dtype=int64), '男': array([0, 2, 4, 6, 7], dtype=int64)}
  1. GroupBy.get_group(name[, obj])
    获得某一个分组的具体信息
In [2]: GroupBy.get_group("男")
Out[2]: 
   年龄 性别  成绩
0  15  男  优秀
2  15  男  及格
4  13  男  及格
6  15  男  优秀
7  16  男   差
  1. Grouper([key, level, freq, axis, sort])

应用

可以先通过循环获得所有的组的名称

for name in GroupBy:
    print(name)# 获得所有分组的名称
    GroupBy.get_group(name) #获得所有该名称的数据
Pandas中的groupby函数和assign函数是用于数据分组和操作的两个重要函数。 groupby函数是一个基于列或者说index的聚合操作。它可以将数据按照指定的列或者index进行分组,并对每个分组应用相应的聚合函数,如求和、均值、最大值等。通过groupby函数,我们可以方便地对数据进行切片、分析和统计,从而更好地理解和分析数据。 assign函数是在Pandas 0.16版本中引入的函数,它可以将新的列添加到DataFrame中。通过assign函数,我们可以根据已有的列进行计算,将计算结果作为新的列添加到DataFrame中。这样可以方便地进行数据转换和衍生列的操作,从而满足特定的需求。 所以,可以说groupby函数和assign函数是Pandas中用于数据分组和操作的两个核心函数。通过它们,我们可以灵活地对数据进行处理和分析,从而更好地理解和利用数据。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [pandas中的groupby、agg](https://blog.youkuaiyun.com/weixin_42633385/article/details/99944312)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Pandas GroupBy对象 索引迭代方法](https://download.youkuaiyun.com/download/weixin_38549721/12866118)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值