从pandas的说明文档中大概可以理解到:一个完整的 groupby 过程可以包括:splitting, applying, transform 三部分。
groupby() 返回的是一个带划分信息的GroupBY对象,此时没有实施具体的切分等操作(如果后续的apply没有必要的话,会尽可能的不进行修改操作)。
例子:
df.groupby( 'column1' ) 将df按照 column1 划分.
df.groupby([ 'column1', 'column2' ]) 将df也可以按多个列划分,先按col1 划分,在划分好的子集内再按col2划分。
df.groupby('col1').mean() 均值
df.groupby('col1').size() 每个子集的大小(类似于count())
df.groupby('col1').sum() 加和
df.groupby('col1').sum() [ 'col3' ] 只看col3的情况
df.groupby('col1')
df.groupby('col1')
df.groupby('col1')