python餐饮数据分析

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.colors as col
import matplotlib.cm as cm
%matplotlib inline

#1.数据加载
dataOne = pd.read_excel('meal_order_detail.xls', sheet_name = 'meal_order_detail1')
dataTwo = pd.read_excel('meal_order_detail.xls', sheet_name = 'meal_order_detail2')
dataThree = pd.read_excel('meal_order_detail.xls', sheet_name = 'meal_order_detail3')

#2.数据预处理(合并数据,NA处理等),分析数据
data = pd.concat([dataOne, dataTwo, dataThree], axis=0) #按行进行拼接数据
data.dropna(axis=1, inplace=True)#按列删除空数据并修改原数据
#统计卖出菜品的平均价格
print(round(np.mean(data['amounts']), 2))#对某一列求平均值并保留两位小数,tips:numpy求平均值比pandas速度快

#频数统计,什么菜最受欢迎(对菜名进行频数统计,取最大前10名)
dishesCount = data['dishes_name'].value_counts()[:10]
dishesCount.plot(kind='line', color='r')
dishesCount.plot(kind='bar', fontsize=10)
xPos = list(range(len(dishesCount)))
plt.rcParams['font.sans-serif'] = 'SimHei'#中文显示
for a, b in zip(xPos, dishesCount):#a,b返回的分别是索引表序号和值
    plt.text(a, b + 0.1, b, ha='center', va='bottom')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值