前言
数据保存在
https://github.com/harkbox/DataAnalyseStudy
数据名称:快餐数据.tsv
(tsv是用\t作为字符分隔符的文件格式;csv是逗号)
因此可以用pandas的read_csv函数读取数据
1.读取数据
import pandas as pd
import matplotlib.pyplot as plot
chipo=pd.read_csv(data_file_name,delimiter='\t')
2.获得数据的一些基本信息
# 查看数据的前5项
chipo.head()
chipo.info()
#产看数据的信息,尤其是缺失值
#产看摘要信息
chipo.describe()
从上述的信息可以发现价格的类型是字符,如果需要用价格进行计算的话,还需要将其转变为float
第一个问题:## 1.下单数最多的商品是什么
将商品按照item_name分组,求和,并且排序就能找到最多的商品是什么
chipo_=chipo[['item_name','quantity']].gro