Matplotlib和Seaborn(条形图)

本文介绍了如何使用Seaborn的barplot函数创建条形图,包括绝对频率和相对频率的表示。内容涉及条形图的创建、缺失值统计,并探讨了在条形图中表示相对频率的不同方法,如改变坐标轴刻度和添加文本注释。此外,还展示了如何用条形图展示数据缺失值的统计。

条形图

条状图的创建:

条形图(也被称为柱形图、柱状图等)用于展示分类变量的分布情况。在条形图中,分类变量的每个类别用长条表示,高度表示数据该类别的出现频率。我们可以通过 seaborn 的 countplot 函数创建基本的频率条形图:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb

%matplotlib inline

其中%matplotlib inline,就可以在Note中直接画图表了

sb.countplot(data = df, x = 'cat_var')//若加分号,则图表绘制对象的信息就不会显示出来了

在这里插入图片描述

对于给出的示例,可以看出,Beta 类别频率最高,超过 100 次,然后是 Gamma 和 Alpha,Delta 的频率最低,大约为 50。默认情况下,每个类别都用不同的颜色标注。当我们探索更多变量时,添加颜色标注可能会对建立这些类别之间的关联性有帮助。其他情况下,建议简化图表,将所有长条都用相同的颜色标注,可以减少不必要的干扰。我们可以使用 “color” 参数设置长条颜色:

base_color = sb.color_palette()[0]
sb.countplot(data = df, x = 'cat_var', color = base_color)

color_palette 返回一个 RGB 元组列表,每个元组由三个数字组成,分别对应红绿蓝通道值,这三个值确定一个颜色。在没有任何参数的情况下调用此函数会返回当前/默认的调色板,我们将默认调色板的第一个颜色设为所有长条的颜色。 在这里插入图片描述 对于条形图,我们可能想要执行的一个操作是以某种方式对数据进行排序。对于无序分类数据,一种常见操作是按照频率对数据排序。我们的数据是 pandas DataFrame 类型,因此我们可以使用各种 DataFrame 的方法来计算和得出排序方式,然后使用 “order” 参数设置排序方式:

base_color = sb.color_palette()[0]
cat_order = df['cat_var'].value_counts().index
sb.countplot(data = df, x = 'cat_var', color = base_color, order = cat_order)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值