dbscan算法是一种基于密度的聚类算法。
该算法的目的在于过滤低密度区域,发现稠密度样本点,跟传统的基于层次聚类和划分聚类的凸形聚类簇不同,该算法可以发现任意形状的聚类簇,与传统的算法相比它有如下优点:
与K-means比较起来,你不必输入你要划分的聚类个数;
聚类簇的形状没有bias;
可以在需要时输入过滤噪声的参数;
DBSCAN中的的几个定义:
Ε领域:给定对象半径为Ε内的区域称为该对象的Ε领域
核心对象:如果给定对象Ε领域内的样本点数大于等于MinPts,则称该对象为核心对象。
直接密度可达:对于样本集合D,如果样本点q在p的Ε领域内,并且p为核心对象,那么对象q从对象p直接密度可达。
密度可达:对于样本集合D,给定一串样本点p

DBSCAN是一种基于密度的聚类算法,能发现任意形状的聚类簇,无需预先设定聚类数量。算法中,核心对象是Ε领域内样本点数大于等于MinPts的对象。直接密度可达和密度可达定义了对象之间的联系,而密度相连则描述了对象间的对称关系。通过这些概念,DBSCAN寻找密度相连对象的最大集合,形成聚类簇。
最低0.47元/天 解锁文章
7819

被折叠的 条评论
为什么被折叠?



