密度聚类又称为“基于密度的聚类”,此类算法假设聚类结构能通过样本分布的紧密程度来确定,通常情形下,密度聚类算法从样本密度的角度来考察样本之间的连续性,并基于可连接样本不断扩展聚类簇已获得最终的聚类结果。
DBSCAN算法是一个著名的密度聚类算法,它基于一组“邻域”参数来刻画样本分布的紧密程度,给定数据集D={x1,x2,..xm},定义下面几个概念
ε-邻域:对xj?D,ε-邻域包含样本集D中与xj的距离不大于ε的样本,(欧式距离)
核心对象:若xj的ε-邻域至少包含MinPts个样本,即邻域样本数》=MinPts ,则xj是一个核心对象。
密度直达;若xj位于xi的ε-邻域中,且xi是核心对象,则称xj由xi密度直达。
算法描述:+例子:
DBSCAN算法详解:一种基于密度的聚类方法

DBSCAN是一种著名的密度聚类算法,它通过ε-邻域和MinPts参数判断样本密度,核心对象是那些拥有足够邻域样本的点。算法流程包括计算邻域值、确定核心对象集合、生成聚类簇并不断迭代,直到所有核心对象都已被处理。此方法适用于发现任意形状的聚类结构。
最低0.47元/天 解锁文章
1474

被折叠的 条评论
为什么被折叠?



