数据可视化:分层语法与绘图构建全解析
1. 分层语法的组件
在数据可视化中,分层语法是构建复杂图形的关键概念。它由多个组件构成,每个组件都有其独特的作用。
1.1 平滑层与统计变换
平滑层与点层不同,它不显示原始数据,而是对数据进行统计变换后显示。例如,平滑层会在数据中间拟合一条平滑的线。这需要在数据映射到美学属性后,进行额外的统计变换步骤。常见的统计变换包括将数据拟合到 loess 平滑器,然后返回数据范围内均匀间隔点的预测值。其他有用的统计变换还有 1D 和 2D 分箱、分组均值、分位数回归和轮廓绘制等。
1.2 缩放的三个步骤
缩放过程分为三个部分:变换、训练和映射。
- 变换 :在统计变换之前进行,确保统计计算是基于缩放变换后的数据。例如,在对数 - 对数图中,数据值先进行对数变换,再映射到绘图位置。常见的变换有平方根、对数和倒数变换等。
- 训练 :在统计计算完成后,每个缩放都要在所有层和分面的每个数据集上进行训练。训练操作会合并各个数据集的范围,得到完整数据的范围。如果没有这一步,缩放只能在局部有意义,不同层的图形就无法正确叠加。
- 映射 :最后,缩放将数据值映射为美学值。这是一个局部操作,每个数据集中的变量被映射到其美学值,生成一个新的数据集,然后由几何对象进行渲染。
下面是绘图生成过程的 mermaid 流程图:
graph LR
A[映射变量到美学属性] --&
超级会员免费看
订阅专栏 解锁全文
1006

被折叠的 条评论
为什么被折叠?



