先贴出我借鉴的博客
- https://blog.youkuaiyun.com/Katherine_hsr/article/details/79382249
- https://blog.youkuaiyun.com/zhouxianen1987/article/details/68945844
DBSCAN是基于密度的聚类算法,和meanshift同是基于密度的算法
以下定义需要了解:
- 核心点:在半径内含有超过minPoints数目的点。
- 边界点:在半径内点的数量小于minPoints,但是落在核心点的邻域内的点。
- 噪音点:既不是核心点也不是边界点的点。
- 直接密度可达:给定一个对象集合D,如果p在q的Eps邻域内,而q是一个核心对象,则称对象p从对象q出发时是直接密度可达的。
- 密度可达:如果存在一个对象链 p1, …,pi,.., pn,满足p1 = p 和pn = q,pi是从pi+1关于Eps和MinPts直接密度可达的,则对象p是从对象q关于Eps和MinPts密度可达的。
- 密度相连:如果存在对象O∈D,使对象p和q都是从O关于Eps和MinPts密度可达的,那么对象p到q是关于Eps和MinPts密度相连的。
若满足直接密度可达,密度相连,密度可达,就可以构成簇

DBSCAN是一种基于密度的聚类算法,它通过核心点、边界点和噪音点的概念进行聚类。算法步骤包括设定半径r和minPoints,遍历数据点,判断是否为核心点或噪音点,最终形成密度可达或密度相连的簇。在实例中,通过判断点之间的Eps邻域和密度关系来划分点的类别。
最低0.47元/天 解锁文章
2621

被折叠的 条评论
为什么被折叠?



