非欧几里得相异性与非参数混合模型聚类技术解析
在数据处理和分析领域,相异性度量和聚类算法是两个重要的研究方向。相异性度量用于衡量数据点之间的差异程度,而聚类算法则是将数据点划分为不同的组或簇。下面我们将深入探讨非欧几里得相异性的原因和信息价值,以及非参数混合模型在聚类中的应用。
非欧几里得相异性的分析
相异性度量在许多实际应用中起着关键作用,然而,非欧几里得和非度量相异性的存在给分析带来了挑战。我们先来看一些常见的数据集及其特点:
- 数据集介绍
- 定位球数据集 :由两类半径略有不同的球组成。
- 高斯数据集(GaussM1 和 GaussM02) :基于两个 20 维正态分布的对象集,使用闵可夫斯基距离 1 和 0.2 分别计算相异性。
- Coil 数据集 :基于 COIL 图像中的相同 SIFT 点集,通过不同的图距离进行比较。
- BrainMRI 数据集 :是从 MRI 脑图像中获得的 182 个相异性度量的平均值。
- 行人数据集(Pedestrians) :是街道图像中检测到的对象(可能是行人)之间的相异性集合,基于从单张图像中提取的特征点集之间的云距离。
从这些数据集的分析中,我们可以观察到一些有趣的现象:
- 非欧几里得特性 :通过负特征分数列(NEF)可以看出,所有数据集都是非欧几里得的。其中,蛋白质集的度量接近欧几里得度量,因
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



