Tableau图表 • 盒须图、抖动图

本文介绍了Tableau中如何制作盒须图和抖动图,盒须图用于展示数据分散情况,包括六个统计量,而抖动图则是盒须图的变形,有助于更清晰地观察数据分布。在Tableau中,通过调整视图详细级别、添加参考线及创建计算字段,可以创建出随机和有序的抖动图。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

盒须图,又叫箱线图,是一种用作显示一组数据分散情况资料的统计图。盒须图能够比较直观的显示数据集的分散程度、异常值等信息。

盒须图

盒须图基础

盒须图包括六个统计量:最小值,下四分位数(Q1),中位数,上四分位数(Q3),最大值、异常值。下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。

上四分位数到最大值之间建立一条延伸线,这个延伸线成为“胡须”。

  • 中位数:所有数据按由高到低顺序排列,处于正中间位置的值。
  • 上四分位数(Q3)、下四分位数(Q1):所有数据按由高到低顺序排列,处于25%位置的值为上四分位数,处于75%位置的值为下四分位数。下四分位数与上四分位数之差,即Q3-Q1,称为四分位距,简称IQR。
  • 上边缘、下边缘:上边缘视为盒须图的最大观测值,下边缘为最小观测值。通常,上边缘=Q3+1.5IQR,下边缘=Q1-1.5IQR。
  • 异常值:位于上边缘或下边缘以外的数据,视为异常值
  • 须:上四分位数到上边缘之间连线,以及下四分位数到下边缘之间的连线,称为“须”,用于表示数据正常值的分布情况。
图:盒须图示例
图:盒须图示例

 

盒须图制作

tableau的智能显示中,已经内置了盒须图图形,可以快捷创

### 蜂群数据可视化中的实现方法与工具 蜂群(Swarm Plot)是一种用于展示数据分布和密度的可视化图表,尤其适用于展示单变量数据的分布情况。相比传统的散点或箱线,蜂群通过将每个数据点以“蜂群”形式排列,避免了数据点的重叠,从而更清晰地呈现数据的分布特征[^1]。 #### 实现方法 1. **数据准备** 蜂群通常适用于单变量或多变量数据集。对于单变量数据,可以直接绘制;对于多变量数据,可以通过分组来展示不同类别之间的分布差异。数据通常以数组或数据框的形式存储。 2. **图表构建** 蜂群的核心在于将数据点排列成蜂群状,避免重叠。这通常通过调整点的位置来实现,确保每个点之间有一定的间距,同时保持其在x轴或y轴上的位置不变。这种排列方式使得数据点的分布更加直观。 3. **与其他图表结合** 蜂群常与其他图表(如箱线、小提琴)结合使用,以提供更多的统计信息。例如,蜂群可以与箱线叠加,既展示数据的分布情况,又显示中位数、四分位数等统计指标。 #### 常用工具 1. **Python中的Matplotlib与Seaborn** Python的Seaborn库提供了`swarmplot()`函数,可以直接用于绘制蜂群。Seaborn基于Matplotlib,因此可以轻松地进行图表的自定义和美化。 ```python import seaborn as sns import matplotlib.pyplot as plt # 加载示例数据集 tips = sns.load_dataset("tips") # 绘制蜂群 sns.swarmplot(x="day", y="total_bill", data=tips) plt.show() ``` 2. **R语言中的ggplot2** R语言的ggplot2包也支持蜂群的绘制,主要通过`geom_swarm()`函数实现。ggplot2是基于层的绘系统,允许用户逐步构建复杂的图表,并且可以与其他几何对象(如箱线、小提琴)结合使用。 ```r library(ggplot2) library(ggbeeswarm) # 提供geom_swarm函数 # 加载示例数据集 data("diamonds") # 绘制蜂群 ggplot(data = diamonds, aes(x = cut, y = price)) + geom_swarm() + theme_minimal() ``` 3. **其他工具** 除了Python和R语言,还有一些其他工具和库支持蜂群的绘制,例如: - **Tableau**:虽然Tableau本身没有直接的蜂群选项,但可以通过散点的“抖动”功能模拟蜂群的效果。 - **D3.js**:JavaScript库D3.js可以用于创建交互式的蜂群,适用于Web应用开发。 - **Plotly**:Plotly支持多种编程语言(如Python、R、JavaScript),并且可以通过简单的API生成交互式蜂群。 #### 应用场景 蜂群广泛应用于数据分析、统计学、生物信息学等领域,尤其适合以下场景: - **小样本数据的可视化**:当数据量较小时,蜂群能够清晰地展示每个数据点的分布情况。 - **多组数据的比较**:通过分组绘制蜂群,可以直观地比较不同组之间的数据分布差异。 - **与其他图表结合**:蜂群可以与箱线、小提琴等结合使用,提供更丰富的统计信息[^1]。 ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值