数据分组:聚合、过滤与转换的实用指南
在数据分析中,对数据进行分组并执行聚合、过滤和转换操作是非常常见且重要的任务。本文将详细介绍如何使用相关方法完成这些操作,并通过具体的示例代码进行演示。
1. 分组基础操作
首先,我们需要了解如何创建分组对象以及如何对分组进行基本操作。以下是创建分组对象的步骤:
1. 创建分组对象 :
import pandas as pd
# 读取数据集
college = pd.read_csv('data/college.csv', index_col='INSTNM')
# 按州进行分组
grouped = college.groupby('STABBR')
# 显示分组数量
print(grouped.ngroups)
# 验证分组数量与唯一州的数量是否一致
print(college['STABBR'].nunique())
在上述代码中,我们使用 groupby 方法按 STABBR (州缩写)对 college 数据集进行分组,并通过 ngroups 属性查看分组数量,同时使用 nunique 方法验证唯一州的数量。
每个分组由一个元组唯一标识,该元组包含分组列中值的唯一组合。我们可以使用 get_group 方法选择特定的分组作为 DataFrame 。
超级会员免费看
订阅专栏 解锁全文
1320

被折叠的 条评论
为什么被折叠?



