pandas分组与聚合

博客围绕pandas的分组与聚合展开。pandas是数据处理重要工具,分组与聚合是其关键操作,可对数据进行有效整理和分析,在数据挖掘、数据分析等领域有重要应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import pandas as pd
import numpy as np


# 加载数据
detail = pd.read_excel('meal_order_detail.xlsx')
# print(detail)

# 分组
# 按照amounts进行分组,然后统计counts平均值
# de = detail.groupby(by='amounts')['counts'].mean()
# print(de)

# 按照order_id 与 dishes_id 进行分组,统计amounts的均值
# de = detail.groupby(by=['amounts','dishes_name'])['counts'].max()
# print(de)
# print(type(de))

# agg方法 --可以对多列数据, 同时进行多列统计分析
# de = detail[['counts', 'amounts']].agg([np.sum, np.mean])
# print(de)

# agg 方法 --对于不同列数据求取不同统计分析
# de = detail.agg({'counts':np.max, 'amounts':np.min})
# print(de)

# agg 方法  --可以对不同那个列数据求取不同的统计分析
# de = detail.agg({'counts':np.max, 'amounts':[np.min, np.mean]})
# print(de)

# apply 自定义统计
# 单列操作
# de = detail['amounts'].apply(lambda x: x+1)
# print(de)

# 多列操作
# de = detail[['counts','amounts']].transform(lambda x:x+1)
# print(de)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值