Python统计分析可视化库——seaborn

Visualization of seaborn

  seaborn[1]是一个建立在matplot之上,可用于制作丰富和非常具有吸引力统计图形的Python库。Seaborn库旨在将可视化作为探索和理解数据的核心部分,有助于帮人们更近距离了解所研究的数据集。无论是在kaggle官网各项算法比赛中,还是互联网公司的实际业务数据挖掘场景中,都有它的身影。

   在本次介绍的这个项目中,我们将利用seaborn库对数据集进行分析,分别展示不同类型的统计图形。

首先,我们将导入可视化所需的所有必要包,我们将使用到的几个包:

  • Numpy
  • pandas
  • matplotlib
  • seaborn
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

   本次使用到的数据集是比较有名的tips(小费)数据集[2]。小费数据集,是一个餐厅侍者收集的关于小费的数据,其中包含了七个变量,包括总费用、付小费的金额、付款者性别、是否吸烟、日期、日间、顾客人数。通过数据分析和建模,可帮助餐厅侍者预测来餐厅就餐的顾客是否会会支付小费。知识改变命运啊~
   让我们先导入tips数据集:

import matplotlib.pyplot as plt
import numpy as np
% %matplotlib inline
import seaborn as sns
tips = pd.read_csv('../input/tips.csv')

让我们看看数据集前面几行,看看数据集究竟长什么样。

tips.head()

这里写图片描述

dist plot图

sns.distplot(tips['total_bill'])

这里写图片描述

sns.distplot(tips['total_bill'],kde = False)

这里写图片描述
看图说话:上图显示,顾客在餐厅的消费总金额主要是在5-35的范围内分布的。

count plot图

sns.countplot(x = 'smoker',  data = tips)

这里写图片描述
看图说话:上图显示,来餐厅就餐的顾客&

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值