基于障碍物和促进因素的密度空间聚类方法
在空间数据聚类中,处理障碍物和促进因素带来的约束是一个重要的研究方向。障碍物会阻碍数据对象之间的可达性,而促进因素则能连接远距离的数据对象或跨越障碍物连接数据对象。下面将详细介绍一种新的空间聚类方法——DBRS+,以及相关的背景知识和实验结果。
1. 背景与问题提出
在实际应用中,如房地产公司规划商场位置时,障碍物(如河流)和促进因素(如高速公路)会对数据对象之间的距离和可达性产生影响。简单的欧几里得距离在这种情况下并不适用,忽略这些因素可能导致聚类结果失真或无用。
2. 相关工作
- COD_CLARANS :这是第一个处理障碍物约束的分区聚类方法。它将两点间的欧几里得距离函数替换为无障碍距离,计算该距离需要进行包括构建可见性图、微聚类和实现空间连接索引等预处理步骤。但该算法不考虑促进因素,也无法处理相交的障碍物,对于密度变化的数据集,其微聚类方法可能不适用于稀疏集群。
- AUTOCLUST+ :是AUTOCLUST的增强版本,可处理障碍物。该算法的优点是用户无需提供参数值,通过构建Delaunay图、计算全局变化指标、删除与障碍物相交的边,最后应用AUTOCLUST进行聚类。然而,它不考虑促进因素,且当两点间没有绕行路径时,距离无法定义。
- DBCLuC :基于DBSCAN,是已知的唯一能同时处理障碍物和促进因素的方法。它通过构建障碍物线来确定可见性,识别入口点和入口边以处理促进因素。但对于凹多边形,构建障碍物线的成本较高,且在某些情况下算法可能无