正则化Ricci流嵌入:解决非欧几里得数据问题
在模式分析领域,非欧几里得相似度或邻近度数据的处理一直是一个具有挑战性的问题。传统的基于欧几里得空间的学习技术在处理这类数据时往往效果不佳。本文将介绍一种通过正则化Ricci流嵌入来解决非欧几里得数据问题的方法,包括其原理、算法步骤以及实验结果。
1. 非欧几里得数据处理背景
在许多实际应用中,对象之间的关系并非由序数测量或特征向量来表征,而是通过非欧几里得的相似度或邻近度来描述。例如,在处理图像、语音等数据时,我们常常使用加权邻近图来表示对象之间的关系。然而,这些相似度数据往往是非欧几里得的,这限制了许多基于几何的学习技术的应用。
为了克服这个问题,一种常见的方法是将非欧几里得的相似度数据表示为加权图,并将其嵌入到流形上,从而将数据投影到固定维度的向量空间中。常见的嵌入方法有多维缩放(MDS)、Isomap、局部线性嵌入和拉普拉斯特征映射嵌入等。这些方法的共同目标是找到数据的低维表示。
2. 嵌入非欧几里得数据
为了衡量一个成对距离矩阵中包含非欧几里得特征的程度,我们可以分析其中心化Gram矩阵的性质。对于一个$N×N$的对称成对相似度矩阵$D$,其中心化Gram矩阵$G$的计算公式为:
$G = -\frac{1}{2}JD^2J$
其中,$D^2$是$D$中元素的逐元素平方,$J = I - \frac{1}{N}11^T$是中心化矩阵,$1$是长度为$N$的全1向量。
我们可以使用“负特征分数”$F_{eigS}$来衡量距离矩阵偏离欧几里得性的程度:
$F_{eigS} = \frac{\sum_{\lambda_i<0} |
超级会员免费看
订阅专栏 解锁全文
9

被折叠的 条评论
为什么被折叠?



