利用Python进行数据聚合和分组运算

#Created by: Darren Chen
#Created on: 2018/8/2

import pandas as pd
import numpy as np
import os,time,sys

#像SQL这种结构化查询语言所执行的分组运算的种类十分有限

'''
    分组键的多种形式:
        1、列表或数组,其长度与待分组的轴长度相同。
        2、DataFrame的某个列名。
        3、字典或Series,给出待分组的值与分组名之间的对应关系。
        4、函数,用来处理轴索引或者索引中的各个标签。
'''

df = pd.DataFrame({'key1':['a','a','b','b','a'],
                    'key2':['one','two','one','two','one'],
                    'data1':np.random.randn(5),
                    'data2':np.random.randn(5)})

print(df)

grouped = df['data1'].groupby(df['key1'])
print(grouped, '\n')          #grouped是一个中间对象
print(grouped.mean(), '\n')
df.groupby(['key1','key2']).size()

#一次传入多个数组
means = df.groupby([df['key1'],df['key2']]).mean()
means
means.unstack()

#分组键可以是任意长的数组
states = np.array(['shandong','zhejiang','zhejiang','shandong','shandong'])
years = np.array([2018,2018,2020,2018,2020])
df.groupby([states,years]).mean()

#可以对分组进行迭代
for name,group in df.groupby
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值