1.对数据进行分组,groupby()
(1)指定分组列
(2)size(),count(),count获取更详细
(3)对数据进行迭代输出
for….in循环输出分组后的结果
(4)将groupby分类结果转化成字典
(5)按照列的数据类型进行分组df.groupby(df.dtypes,axis=1),默认(axis=0)是按行

(6)选择分类数据中的一个或一组


2.分组计算
(1)通过字典或者Series进行分组
(2)sum(),count()
(3)常用的分组计算max(),min()。查看属性describe()


3.函数agg(func),进行聚合操作
(1)定义函数,获取DataFrame中某一列数据的最大值和最小值之差
(2)调用多个聚合函数
peak_range是求最大值和最小值之差的函数
(3)对函数加元组,提供新的列名
(4)使用字典实现数据集的每列作用不同的聚合函数
(5)as_index。 传入as_index是否将行索引作为索引

4.使用内置的聚合函数


本文介绍Pandas中数据分组与聚合的基本操作方法,包括如何使用groupby()函数进行数据分组,如何利用size(), count()等函数获取分组信息,以及如何通过max(), min(), sum()等内置函数进行分组计算。此外,还介绍了如何定义自定义函数并应用于分组数据上,实现更复杂的业务需求。
6987

被折叠的 条评论
为什么被折叠?



