使用python分组聚合execl

数据解释:sex>性别,smoker>是否抽烟,day>天,time>时间,size>就餐人数,total_size>餐费,tip>小费

1.加载包

import numpy as np
import pandas as pd

2.加载数据

df = pd.read_excel('/mnt/workspace/canting.xlsx')
df.head(5)

3.将餐费和小费加起来,并单独创建一列

df['total_sum'] = df['total_size'] + df['tip']
df.head(5)

4.查看数据的特征

df.describe(include='all')

5.统计不同时间,不同人数的订单数

df['time'].value_counts()
df['time'].value_counts(normalize=True)# 占比
df['size'].value_counts()
df['size'].value_counts().sort_index()# 按照索引排序
df['size'].value_counts(normalize=True).sort_index()

6.# 求不同日期消费金额数

df.groupby('day')[['size', 'total_sum']].agg(np.sum)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值