Seaborn库
Seaborn自带一些数据集,如penguins(企鹅的种类,生活的岛屿,重量等),tips(顾客的账单,消费时间等)等。
Seaborn库可简写为sns:import seaborn as sns
一.dispolt:绘制变量分布的函数,查看变量的分布,默认绘制直方图。
sns.displot(data = ...,x = ...)
1.histplot:绘制直方图。
sns.hisplot(data = ...,x = ...)或sns.displot(data = ...,x = ...)
说明:可以添加参数bins,表示将x轴上的数据分成多少等份;参数hue,表示不同的颜色;参数shrink,表示柱状图的宽度。
2.kdeplot:绘制曲线,相比于直方图,数据分布的规律更明显。
sns.displot(data = ...,x = ...,kind = “kde”)或sns.kdeplot(data = ...,x = ...)
说明:(1)曲线边缘处可能超出数据取值范围,可添加参数cut:sns.kdeplot(data = ...,x = ...,cut = 0)
(2)可以用于比较训练集和测试集变量分布是否一致。
3.ecdfplot:经验累积分布函数。
sns.displot(data = ...,x = ...,kind = “ecdf”)
4.rugplot:绘制在图的边缘,不占空间。
5.说明:(1)displot中可以添加参数log_scale对数据作对数处理,取值为Ture或False。
(2)displot具有FacetGrid特性:按照不同的组合,将数据集划分为多个类别。
二.relplot:分析两个变量关系的函数,绘制散点图。
sns.relplot(data = ...,x = ...,y = ...)
1.scatterplot
2.lineplot:连线图,适合连续变化的数据,如股价波动。
sns.relplot(data = ...,x = ...,y = ...,kind = “line”)
3.说明:可以添加参