**DBSCAN算法和实现
——DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法,它是一种适应性极强的聚类算法,不同于K-means聚类,它无需确定簇的数量k,可以自己基于密度来实现。首先介绍一下几个基本的概念。
基础概念
1.密度:密度指的是在某距离内含有对象的最小数目。
2.核心对象:如果一个对象的eps邻域内至少包含MinPt个对象,则称该对象是核心对象。
3.直接密度可达:给定一个对象集合D,如果p在q的eps邻域内,并且q是一个核心对象,则p是从q直接密度可达的。(如下图所示),eps可以想象为一个超球体的半径,Minp就是这个超球体内的点,这样比较容易理解。
4.密度可达:对于q和p之间,有一个样本序列p1,p2,p3,……,pn, 其中p1=q, pn=p,若Pi+1是由Pi直接密度可达的(关于eps和MinPts),则对象p是由q关于eps和MinPts密度可达的。(如下图所示)