可视化中的数学基础
1. 数据与基本术语
数据是所有可视化任务和可视化流程中每个步骤的核心。可视化流程的输入,即原始数据,可以是任何形式的信息集合。我们将数据集定义为一个三元组 $D = (S, A, f)$,它由一组结构化项 $S$、一组属性 $A$ 以及一个将属性分配给项的函数 $f$ 组成。
1.1 结构 $S$
结构 $S$ 可以从离散点到连续域不等。一般来说,$S$ 由一组项和项之间的某种关系组成。以下是两种最常用的结构:
- 图、网络和树 :图或网络常用于非空间、关系型数据表示。数学上,图 $G$ 是一个对 $(V, E)$,其中 $V$ 是一组项(称为顶点或节点),$E$ 是这些项之间的关系集合(表示为边的集合,$E \subseteq V \times V$)。边可以是有向的或无向的。如果边被赋予一个数值属性,则该图是加权的。有限图的一种可能表示是邻接矩阵,它是一个大小为 $|V| \times |V|$ 的方阵。
- 连续域 :连续域 $D$ 是 $R^n$ 的一个子集,并配备了一个度量。常见的度量是欧几里得距离,其他度量包括曼哈顿距离和极距离。连续域可以由一组有限的离散样本与插值方案相关联来表示。
1.2 属性空间 $A$
属性是分配给数据项的特定属性,它来自测量、观察或计算。属性可以是连续的和定量的(如温度)、离散的和有序的(如班级中的人数)以及分类的(如各种树种)。可能的属性集合构成了属性空间。
最常见的连续定量属性可以归纳为张量。$r$ 阶张量定义为一个多线性映射,它作用于 $n$ 维向量空间
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



