dataframe 的 groupby提供了分组,切片,切块的操作,根据一列或者多列进行拆分数据。
对于分组后的数据可以计数,平均值,众数等等。同样通过各种函数还可以进行透视表,交叉表,分位表等等分组的分析
groupby函数:
用法:
data.groupby(df[‘key’])
返回值:
dataframe重构数据,且key会变成新的索引,可以dic(list())转为字典通过key查看。
测试案例
生成dataframe数据
import pandas as pd
import numpy as np
df = pd.DataFrame({
'key1':list('aacca'),
'key2':[1,2,3,2,2],
'data1':[2,4,7,5,3],