目录
DBSCAN(Density—Based Spatial Clustering of Application with Noise)算法是一种典型的基于密度的聚类方法,即要求聚类空间中的一定区域内所包含对象(点或其他空间对象)的数目不小于某一给定阈值,它将簇定义为密度相连的点的最大集合。该方法能在具有噪声的空间数据库中发现任意形状的簇,可将密度足够大的相邻区域连接,能有效处理异常数据,主要用于对空间数据的聚类,
1. 基本概念
DBSCAN 算法中有两个重要参数:Eps 和 MmPtS。
- Eps:定义密度时的邻域半径;
- MmPts :定义核心点时的阈值,形成簇所需的最小核心点数量
在 DBSCAN 算法中将数据点分为以下 3 类。
1)核心点:稠密区域内部的点
如果一个对象在其半径 Eps 内含有超过 MmPts 数目的点,则该对象为核心点。
2)边界点:稠密区域边缘的点