XNN图:一种创新的邻域图结构
1. 引言
邻域图在数据挖掘、机器学习和计算机视觉领域被广泛用于数据建模,常见的应用场景包括:
- KNN分类器
- 流形学习
- 3D对象匹配
- 聚类
- 异常值检测
- 旅行商问题
- 网络挖掘中的单词相似度计算
常见的邻域图定义有 ɛ - 邻域和 k - 最近邻(KNN)图。在 ɛ - 邻域中,若两点距离在 ɛ 以内,则它们互为邻居;KNN 图中,一个点的邻域是数据空间中与它最近的 k 个点。对应的图中,相邻点相互连接, ɛ - 邻域图是无向图,而 KNN 图是有向图。
然而,KNN 和 ɛ - 邻域图都存在一些问题:
- 参数选择困难 :参数 ɛ 和 k 的选择对结果影响显著。邻域越大,越能捕捉局部结构,但图会更复杂,处理时间也会增加。当 k 等于数据大小(k = N)时,会得到完全图。固定的 k 值可能导致稀疏区域出现不必要的长边,无法有效捕捉局部结构。
- 图的连通性无法保证 :这可能导致错误的聚类结果。对于某些数据,可通过增大 k 值解决连通性问题,但在高维数据中,通常需要将 k 设置得很大,这会使计算量剧增。而且,目前没有很好的自动设置 k 值的方法,k 值也无法适应局部密度。
为解决这些问题,本文引入了一种新的邻域图——XNN。其核心思想是像 KNN 一样建模局部结构,但邻域大小可变,能根据数据局部情况自动调整。在密集区域会有更多边,稀疏区域边较少,从而既能捕捉局部结构,又能保证图的连通性。
-1
超级会员免费看
订阅专栏 解锁全文
499

被折叠的 条评论
为什么被折叠?



