seaborn可视化学习

最新推荐文章于 2025-09-07 09:18:20 发布

原创最新推荐文章于 2025-09-07 09:18:20 发布 · 762 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #可视化

文本挖掘学习专栏收录该内容

9 篇文章

订阅专栏

本文详细介绍使用Seaborn库对京东商城耳机销售数据进行多种图表分析的过程，包括散点图、箱线图、小提琴图等，展示了数据可视化在理解复杂数据集中的应用。

Seaborn is a Python data visualization library based on matplotlib.

Seaborn提供了大量的高级接口和自定义主题，并能很好地处理数据流。结合美学与技术，其是Python流行的数据可视化库之一。本次学习主要对京东商城爬取的耳机数据进行系列可视化操作。

df['新评价星级'] = 'NA' # 新增一列

for i in range(len(df)):
    if df['评价星级'][i] == 'star1':
        df['新评价星级'][i] = 1.0
    elif df['评价星级'][i] == 'star2':
        df['新评价星级'][i] = 2.0
    elif df['评价星级'][i] == 'star3':
        df['新评价星级'][i] = 3.0
    elif df['评价星级'][i] == 'star4':
        df['新评价星级'][i] = 4.0
    else:
        df['新评价星级'][i] = 5.0
        
df['新评价星级'] = (df['新评价星级']).astype(np.float) # 类型转换

sns.relplot(x='点赞数', y='评论数', hue='新评价星级', data=df) # 色调代表样本类别，样本类别连续

在这里插入图片描述

sns.relplot(x='点赞数',y='评论数',size='新评价星级',data=df) # 改变点大小

在这里插入图片描述

2 抖动图

sns.catplot(x='新评价星级',y='评论数',data=df) # 绘制抖动图

在这里插入图片描述
我们可以看到图表是散开的，所以为了处理这个问题，我们可以将抖动设置为false。抖动是偏离真实值。因此，我们将使用另一个参数将抖动设置为false。

sns.catplot(x='新评价星级',y='评论数',jitter=False,data=df) # 使抖动集中

在这里插入图片描述
如果想在图中引入另一个变量或另一个维度，可以使用hue参数。

sns.catplot(x='点赞数', y='评论数', hue='新评价星级', data=df) # 在图中引入另一变量或维度

在这里插入图片描述

sns.catplot(x='点赞数', y='评论数', kind='swarm', data=df) #swarm使用一种算法来防止点重叠

在这里插入图片描述

3 箱线图

sns.catplot(x='新评价星级', y='评论数', kind='box', data=df) # 箱线图

在这里插入图片描述

4 小提琴图

sns.catplot(x='新评价星级', y='评论数', kind='violin', data=df) # 小提琴图

在这里插入图片描述

5 直方图

sns.distplot(df.点赞数) # 默认情况下，distplot()函数绘制柱状图并适合内核密度估计

在这里插入图片描述

sns.distplot(df.点赞数, kde=False, rug=True) # 有垂直标尺的直方图

在这里插入图片描述

6 双变量分布图

sns.jointplot(x='新评价星级', y='评论数', data=df) # 可视化双变量分布

在这里插入图片描述

sns.jointplot(x='新评价星级', y='评论数', kind='hex', data=df) # Hexplot是一个双变量的直方图，显示了在六边形区域内的观察次数

在这里插入图片描述

sns.jointplot(x='新评价星级', y='评论数', data=df, kind='kde') # KDE绘图，很好的可视化双变量分布的方法

在这里插入图片描述

7 热图

# Heatmaps中每个变量都表示为一种颜色
corrmat = df.corr()
f, ax = plt.subplots()
sns.heatmap(corrmat, vmax=.8,square=True)

在这里插入图片描述

8 多二元分布图

sns.pairplot(df) # 绘制数据集中的多个二元分布，并绘制各变量在对角线上的单变量分布图

在这里插入图片描述

9 回归图

sns.lmplot(x='点赞数', y='评论数', hue='新评价星级', data=df)

在这里插入图片描述

本次学习主要参考资料：Python Seaborn综合指南，成为数据可视化专家

seaborn可视化学习

目录

1 散点图

2 抖动图

3 箱线图

4 小提琴图

5 直方图

6 双变量分布图

7 热图

8 多二元分布图

9 回归图