需要源码请点赞关注收藏后评论区留言私信~~~
基于密度的聚类
基于划分和聚类和基于层次的聚类往往只能发现凸型的聚类簇,为了更好的发现任意形状的聚类簇,提出了基于密度的聚类算法
算法原理
基于密度的聚类算法的主要思想是:只要邻近区域的密度(对象或数据点的数目)超过某个阈值 ,就把它加到与之相近的聚类中。也就是说,对给定类中的每个数据点,在一个给定范围的区域中必须至少包含某个数目的点
基于密度的聚类算法代表算法有:DBSCAN算法、OPTICS算法及DENCLUE算法等
DBSCAN算法涉及2个参数5个定义
2个参数:
Eps: 邻域最大半径
MinPts: 在 Eps 邻域中的最少点数
五个定义如下图所示
定义1(Eps邻域) 给定一个对象 p ,p 的Eps 邻域 NEps(p)定义为以 p 为核心,以Eps为半径的d 维超球体区域,即: 其中,D为d维实空间上的数据集, dist ( p, q)表示D中的2个对象p和q之间的距离。