条形图
条状图的创建:
条形图(也被称为柱形图、柱状图等)用于展示分类变量的分布情况。在条形图中,分类变量的每个类别用长条表示,高度表示数据该类别的出现频率。我们可以通过 seaborn 的 countplot 函数创建基本的频率条形图:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
%matplotlib inline
其中%matplotlib inline,就可以在Note中直接画图表了
sb.countplot(data = df, x = 'cat_var')//若加分号,则图表绘制对象的信息就不会显示出来了

对于给出的示例,可以看出,Beta 类别频率最高,超过 100 次,然后是 Gamma 和 Alpha,Delta 的频率最低,大约为 50。默认情况下,每个类别都用不同的颜色标注。当我们探索更多变量时,添加颜色标注可能会对建立这些类别之间的关联性有帮助。其他情况下,建议简化图表,将所有长条都用相同的颜色标注,可以减少不必要的干扰。我们可以使用 “color” 参数设置长条颜色:
base_color = sb.color_palette()[0]
sb.countplot(data = df, x = 'cat_var', color = base_color)
color_palette 返回一个 RGB 元组列表,每个元组由三个数字组成,分别对应红绿蓝通道值,这三个值确定一个颜色。在没有任何参数的情况下调用此函数会返回当前/默认的调色板,我们将默认调色板的第一个颜色设为所有长条的颜色。
对于条形图,我们可能想要执行的一个操作是以某种方式对数据进行排序。对于无序分类数据,一种常见操作是按照频率对数据排序。我们的数据是 pandas DataFrame 类型,因此我们可以使用各种 DataFrame 的方法来计算和得出排序方式,然后使用 “order” 参数设置排序方式:
base_color = sb.color_palette()[0]
cat_order = df['cat_var'].value_counts().index
sb.countplot(data = df, x = 'cat_var', color = base_color, order = cat_order)

本文介绍了如何使用Seaborn的barplot函数创建条形图,包括绝对频率和相对频率的表示。内容涉及条形图的创建、缺失值统计,并探讨了在条形图中表示相对频率的不同方法,如改变坐标轴刻度和添加文本注释。此外,还展示了如何用条形图展示数据缺失值的统计。
最低0.47元/天 解锁文章
1334

被折叠的 条评论
为什么被折叠?



