数据分类/组处理
groupby() 分组函数
分组之后必聚合,只对数字的列聚合
单列进行分组
data.groupby(“attack_range”).mean()[“hp_max”]
使用列表进行多条件分组
data.groupby([“attack_range”,“role_main”]).mean()[“hp_max”]
对不同列求不同的聚合指标
gp = data.groupby([“attack_range”])
gp.agg({“hp_max”:“mean”,“mp_max”:“min”})
数据聚合是数据处理的最后一步,通常是要使每一个数组生成一个单一的数值/
数据分类处理:
- 分组:先把数据分为几组
- 用函数处理:为不同组的数据应用不同的函数以转换数据
- 合并:把不同的组得到的结果合并起来
数据处理的核心: - groupby()函数
- groups属性查看分组情况
练习:

data = DataFrame(data={
"item":np.random.randint(0,100,size=(100)),
"color":np.random.randint(1,4,size=(100)),
"weight":np.random.random(size=100)*100 + 50,
"price":np.random.random(size=100

本文介绍了数据分类/组处理的技巧,包括使用groupby函数进行单列或多条件分组,对不同列求不同聚合指标,以及高级数据聚合操作如transform和apply。还探讨了交叉表和透视表的概念,它们是数据分析中的重要工具,用于计算分组频率和数据汇总。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



