官方文档语法格式:
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=_NoDefault.no_default, squeeze=_NoDefault.no_default, observed=False, dropna=True)
其中有很多参数,具体参数含义可参考官方文档:
pandas.DataFrame.groupby — pandas 1.5.0 documentation
作用就是对DataFrame进行分组,可以单类分组,也可以多类分组
使用单特征对数据进行分类:
in:
import pandas as pd
import numpy as np
df = pd.DataFrame({'key1':list('aabba'),'key2':[1,2,1,2,1],'data1':np.random.randn(5),'data2':np.random.randn(5)})
df
out:
key1 key2 data1 data2
0