数据分类/组处理
groupby() 分组函数
分组之后必聚合,只对数字的列聚合
单列进行分组
data.groupby(“attack_range”).mean()[“hp_max”]
使用列表进行多条件分组
data.groupby([“attack_range”,“role_main”]).mean()[“hp_max”]
对不同列求不同的聚合指标
gp = data.groupby([“attack_range”])
gp.agg({“hp_max”:“mean”,“mp_max”:“min”})
数据聚合是数据处理的最后一步,通常是要使每一个数组生成一个单一的数值/
数据分类处理:
- 分组:先把数据分为几组
- 用函数处理:为不同组的数据应用不同的函数以转换数据
- 合并:把不同的组得到的结果合并起来
数据处理的核心: - groupby()函数
- groups属性查看分组情况
练习:
data = DataFrame(data={
"item":np.random.randint(0,100,size=(100)),
"color":np.random.randint(1,4,size=(100)),
"weight":np.random.random(size=100)*100 + 50,
"price":np.random.random(size=100