数据降维相关知识与应用
1. 术语与符号
在数据降维的领域中,当一个变量在数据空间和嵌入空间有双重定义时,通常在数据空间用希腊字母表示,在嵌入空间用对应的拉丁字母表示。以下是一些常见的术语和符号:
| 类别 | 符号 | 含义 |
| ---- | ---- | ---- |
| 度量数据 | D, E, M, K | 数据空间、嵌入空间、数据流形、核展开空间 |
| | δ, d, ∂ | 数据空间、嵌入空间和数据流形的维度 |
| | i, j | 点的索引 |
| | ξi, xi | 数据或嵌入空间中的点 i |
| | ij, Dij | 数据或嵌入空间中 i 点和 j 点之间的距离 |
| | γij, gij | 数据或嵌入空间中 i 点和 j 点之间的相似度 |
| | ρij, rij | 数据或嵌入空间中 j 点在 i 点邻域中的邻域排名 |
| 降维 | τ | 权衡参数 |
| | wij | 与邻域关系 i ∼j 相关的权重 |
| | ζ | 应力函数 |
| |, | 高维空间和低维空间之间的映射 |
| | ˇI, I | 地图评估的质量和失真指标 |
| | F, M | 错误和遗漏邻域失真指标 |
| 邻域特征 | i ∼j | 点 i 和 j 之间的邻域关系 |
| | κ | 邻居数量 |
| | σi, si | 数据和嵌入空间中与点 i 相关的缩放因子 |
| | λi, li | 数据和嵌入空间中与点 i 相关的核的自由度 |
| | βij, bij | 数据和嵌入空间中 j