约定:
import pandas as pd
import numpy as np
GroupBy分组
对数据进行分组并对每个分组进行运算是数据分析中很重要的环节。该博客讲解了利用pandas的Groupby技术如何进行分组。下图简单介绍了分组的过程:
- 创建DataFrame对象
df1=pd.DataFrame({
'Data1':np.random.randint(0,10,5),'Data2':np.random.randint(10,20,5),'key1':list('aabba'),'key2':list('xyyxy')})
df1
代码结果:
Data1 | Data2 | key1 | key2 | |
---|---|---|---|---|
0 | 5 | 15 | a | x |
1 | 2 | 15 | a | y |
2 | 6 | 17 | b | y |
3 | 9 | 16 | b | x |
4 | 9 | 13 |