1.对原始小费数据初步分析
(1)加载数据
import numpy as np
import pandas as pd
fdata=pd.read_excel('./tips.xls')
display(fdata)
运行结果如下:
(2)分析数据
a.查看数据的描述信息。
fdata.describe()
运行结果如下:
b.修改列名为汉字,并显示前5行数据。
#修改列名为汉字。
fdata.rename(columns=({'total_bill':'消费总额','tip':'小费','sex':'性别','smoker':'是否抽烟','day':'星期','time':'聚餐时间段','size':'人数'}),inplace=True)
display(fdata.head())
运行结果如下:
c.增加一列“人均消费”,并显示前5行数据。
fdata['人均消费']=round(fdata['消费总额']/fdata['人数'],2)
display(fdata.head())
运行结果如下:
d.查询查询男性午餐人均消费大于10的数据。
# 方法1:
maledata=fdata[(fdata['性别']=='Male')&(fdata['聚餐时间段']==