非线性嵌入映射投影降维与黎曼自组织映射
在数据处理和分析领域,降维技术和自组织映射是非常重要的研究方向。降维技术可以帮助我们在高维数据中提取关键信息,而自组织映射则可以学习数据的拓扑邻域结构。下面将详细介绍两种相关的方法:非线性嵌入映射投影降维方法和黎曼自组织映射。
非线性嵌入映射投影降维方法
在高维空间中,数据的模式通常可以想象为属于低维流形或聚类。为了进行高效的相似性搜索,研究人员提出了多种降维方法。
线性嵌入映射
之前的工作将 SOM 聚类与 PCA 结合,将每个聚类中的单词投影到低维空间以加速相似性搜索。但对于复杂模式,单一地图难以建模,使用更大的 SOM 训练困难且检索时间长。因此,提出使用 GHSOM 层次地图来定义低维空间,将低层次地图嵌入到由第一层地图定义的输出空间中,再将输入点投影到该空间。
例如,在图 1 中展示了将二阶地图(Map2)线性嵌入到其父地图(Map1)的过程。SOM 聚类中心属于二维网格,通过递归线性缩放将 Map2 嵌入到 Map1 中得到 Map3,从而更精细地描述 Map1 中对应神经元的区域。
非线性嵌入映射构建
为了更好地反映聚类中心的相似性,提出了非线性嵌入方法。在计算表示输入训练模式的 GHSOM 后,使用 Sammon 映射重新排列根级地图的神经元。具体步骤如下:
1. 计算 Sammon 映射 :对根地图中的神经元进行 Sammon 映射。
2. 计算 Voronoi 图 :为了确定嵌入第二层地图的区域,计算根神经元的 Voronoi 图。为避免开
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



