前言
小提琴图 (Violin Plot)是用来展示多组数据的分布状态以及概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。跟箱形图类似,但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。
箱线图是Tableau中自带的图形,但要实现小提琴图就有点难度了。
下面我就根据Gwilym的方法,教大家自制一个小提琴图。原理都略过,只取干货。
创建数据集
Sample ID,Sample Value,Group
1,6.2,male
2,5.1,male
3,1.9,male
4,-0.4,male
5,-1.3,male
6,-2.1,male
1,5.2,female
2,4.1,female
3,0.9,female
4,-1.4,female
5,-2.3,female
6,-3.1,female
数据集沿用Gwilym文章里的,为了增加一点点难度,我增加了一列Group。
x
0
1
2
……
97
98
99
辅助表就是一个0-99,步长为1的等差数列。
内联接两张数据表。