类引导邻域嵌入方法(CGNE)的深入解析
在数据处理和分析领域,如何有效地将高维数据映射到低维空间,同时保留数据的结构和类别信息,一直是一个重要的研究方向。类引导邻域嵌入方法(CGNE)在这方面展现出了独特的优势,下面将对其进行详细介绍。
1. ClassNeRV方法特点
ClassNeRV是一种具有监督性质的邻域嵌入方法。与其他方法相比,它在高尺度κ下的性能表现有所不同。在类纯度方面,ClassNeRV的映射比无监督方法能带来更高的纯度,但低于大多数其他有监督方法。
- 最大监督情况 :最大监督的ClassNeRV专注于类的凝聚和区分,避免不相关类的重叠和分裂。它倾向于提供一个类清晰分离的映射,但会忽略一些类间关系,对数据结构的保留有轻微影响,不过这种影响远低于其他有监督方法。
- 中等监督情况 :中等监督的ClassNeRV在各项指标上通常介于NeRV和最大监督的ClassNeRV之间,且大多更接近指标值较高的方法。因此,在尝试同时保留类和结构时,中等监督的ClassNeRV可能是一个不错的折衷方案。
2. Isolet 5数据集案例研究
Isolet 5数据集具有其独特性,由于不同字母(即类)之间的口语相似性较难直观判断,所以该数据集通过纯度矩阵来表征。纯度矩阵的每个元素 (i, j) 表示类 i 的点的κ邻域中类 j 的点的平均比例(κ = 32),它能反映数据空间中类之间的接口或重叠情况。
- ClassNeRV映射结果 :使用最大监督的Cl