密度聚类算法:DBSCAN与OPTICS详解
1. 密度聚类简介
密度聚类旨在解决基于模型聚类的难题。它假定待聚类对象集源于高斯分布的混合,将聚类视为具有高对象密度的非相似度空间子集,这些高密度区域由低密度区域分隔。常见算法有DBSCAN、DENCLUE和OPTICS。该方法不预设聚类形状,且允许存在不属于任何聚类的噪声对象。
2. DBSCAN算法核心概念
2.1 核心、边界和噪声对象
- 核心对象 :设 $D$ 是度量空间 $(S, d)$ 的子集,$B[x, \epsilon]$ 是以 $x$ 为中心、半径为 $\epsilon$ 的闭球,$B_D[x, \epsilon] = B[x, \epsilon] \cap D$。若 $|B_D[x, \epsilon]| \geq m$,则 $x$ 是 $(\epsilon, m)$ - 核心对象。
- 边界对象 :若 $x$ 是核心对象,$y \in B_D[x, \epsilon]$ 且 $|B_D[y, \epsilon]| < m$,则 $y$ 是 $(\epsilon, m)$ - 边界对象。
- 噪声对象 :既非核心对象也非边界对象的对象为 $(\epsilon, m)$ - 噪声对象。
例如,当 $\epsilon = 2$,$m = 6$ 时,若 $|B_D[x, 2]| = 8$,则 $x$ 是核心对象;若 $|B_D[s, 2]| = 5$,则 $s$ 是边界对象;若 $|B_D[
超级会员免费看
订阅专栏 解锁全文
1884

被折叠的 条评论
为什么被折叠?



