比K-mean稳定
1、需要指定半径r、阈值
2、在某个点指定半径为r的邻域内(圆),包含的样本个数不少于阈值n,则当前的点是核心对象
(每个点的密度达到设定的阈值,则为核心对象)
3、直接密度可达:q0是核心对象,q1是q0核心对象邻域内的点,q0→q1直接密度可达
密度可达(传播):q0是核心对象,q1是q0核心对象邻域内的点,同时q1也是核心对象,
q2是q1核心对象邻域内的点,q0→q2密度可达
密度相连:q0→q2密度可达,则q0和q2是密度相连的
4、边界点:根据密度可达的传播性,最后一个点的领域内已经没有样本点落入了,
则最后这个点就是边界点
5、噪声点:不属于任何一个类簇的点,噪声点是任意核心点不可达。


6、离群点的概念说明DBSCAN能用来做异常点检测
7、工作流程:
输入数据值→指定半径→指定密度阈值MinPts
2781

被折叠的 条评论
为什么被折叠?



