基于密度定义,我们将点分为:
- 稠密区域内部的点(核心点)
- 稠密区域边缘上的点(边界点)
- 稀疏区域中的点(噪声或背景点).
DBSCAN算法的本质就是随大流,边界点紧紧围绕着核心点,他们抱团,不带噪点玩儿
小团体多了,联系比较密切的小团体之间聚成了同个类
比较偏远的小团体想要加入这个圈子,进不去,就单干,我们自己玩自己的,聚成了另外的一个类
一开始就被孤立的噪点吧,自然有自己的傲骨,接着孤芳自赏
算法原理
DBSCAN通过检查数据集中每点的Eps邻域来搜索簇,如果点p的Eps邻域包含的点多于MinPts个,则创建一个以p为核心对象的簇。
然后,DBSCAN迭代地聚集从这些核心对象直接密度可达的对象,这个过程可能涉及一些密度可达簇的合并