数据处理Seaborn库

最新推荐文章于 2025-04-12 21:27:05 发布

予过维扬z

最新推荐文章于 2025-04-12 21:27:05 发布

阅读量590

点赞数 3

CC 4.0 BY-SA版权

文章标签： python

本文链接：https://blog.youkuaiyun.com/2302_79759425/article/details/141475915

Seaborn库
Seaborn自带一些数据集，如penguins（企鹅的种类，生活的岛屿，重量等）,tips（顾客的账单，消费时间等）等。
Seaborn库可简写为sns：import seaborn as sns

一．dispolt：绘制变量分布的函数，查看变量的分布，默认绘制直方图。
sns.displot(data = ...,x = ...)
1.histplot:绘制直方图。
sns.hisplot(data = ...,x = ...)或sns.displot(data = ...,x = ...)
说明：可以添加参数bins，表示将x轴上的数据分成多少等份；参数hue，表示不同的颜色；参数shrink，表示柱状图的宽度。
2.kdeplot：绘制曲线，相比于直方图，数据分布的规律更明显。
sns.displot(data = ...,x = ...,kind = “kde”)或sns.kdeplot(data = ...,x = ...)
说明：（1）曲线边缘处可能超出数据取值范围，可添加参数cut：sns.kdeplot(data = ...,x = ...,cut = 0)
（2）可以用于比较训练集和测试集变量分布是否一致。
3.ecdfplot：经验累积分布函数。
sns.displot(data = ...,x = ...,kind = “ecdf”)
4.rugplot：绘制在图的边缘，不占空间。
5.说明：（1）displot中可以添加参数log_scale对数据作对数处理，取值为Ture或False。
（2）displot具有FacetGrid特性：按照不同的组合，将数据集划分为多个类别。

二．relplot：分析两个变量关系的函数，绘制散点图。
sns.relplot(data = ...,x = ...,y = ...)
1.scatterplot
2.lineplot：连线图，适合连续变化的数据，如股价波动。
sns.relplot(data = ...,x = ...,y = ...,kind = “line”)
3.说明：可以添加参