前言
聚类算法是无监督学习中最经典的问题之一,虽然 K-Means 用得广泛,但它有明显的局限性:
- 无法识别任意形状的簇
- 需要提前指定簇的个数 K
- 对噪声和离群点非常敏感
上一篇介绍了K-Means算法,本文将介绍一下DBSCAN(Density-Based Spatial Clustering of Applications with Noise)基于密度的噪声应用空间聚类,可以不用担心这些局限!
DBSCAN简介
DBSCAN 是一种基于密度的聚类算法,核心思想是:
“密度高的区域形成簇,密度低的区域是噪声或边界”。
与 K-Means 不同,DBSCAN 不要求指定簇的个数,而是通过“密度”定义簇。
DBSCAN 的核心概念
1. 邻域(ε邻域)
对于任意一点 ppp,其ε邻域是以 ppp 为圆心、半径为 ε 的圆(或球)内的点。
2. 密度可达(density reachable)
如果点 qqq 在点 ppp 的 ε 邻域内,且 ppp 是“核心点”,那么

最低0.47元/天 解锁文章
2434

被折叠的 条评论
为什么被折叠?



