在使用pandas进行分组迭代求和时,分组后的对象一直不知道怎么迭代出来,其实可以两步进行,先按照key分组,然后进行sum,mean等操作。
如下代码中,name 是key, 后面的group是根据key分的元素集合,可以进行求和等操作。
import pandas as pd
import numpy as np
df = pd.DataFrame({'key1': ['a', 'a', 'b', 'b', 'a'], 'key2': ['one', 'two', 'one', 'two', 'one'],
'data1': [1, 2, 3, 2, -4], 'data2': [1, 0, 1, 2, 2]})
for name, group in df.groupby('key1'):
print(name)
print(group['data1'].sum())
# 多键的情况
for (k1, k2), group in df.groupby(['key1', 'key2']):
print(k1, k2)
print(group['data2'].mean())
第一个for输出:a 、b是分组的key,后部分是求和的值
第二个for输出:
这样就可以支持pandas分组进行各种操作了