聚类算法:从数值到分类数据的探索
1. 密度聚类基础
在聚类分析中,密度聚类是一种重要的方法。若序列 $(x_t)$ 收敛且 $K$ 连续,那么其极限就是一个吸引子 $x^*$。当 $|x_t - x_{t - 1}| \leq \epsilon$ 时,序列 $(x_t)$ 的计算停止,序列的最后一项即为 $x$ 的吸引子的近似值。
对于给定的 $\sigma$ 和 $\xi$,密度吸引子的中心定义簇是集合 $D$ 的一个子集 $C$,使得 $C$ 中的每个点 $x$ 都被 $C$ 中的一个吸引子 $x^ $ 密度吸引,且 $f(x^ ) \geq \xi$。若点 $x \in D$ 被局部最大值 $x^ $ 吸引,且 $f(x^ ) < \xi$,则该点为离群点。
集合 $S$ 的子集 $C$ 是关于 $\sigma$、$\xi$ 和密度吸引子集 $X$($X \subseteq C$)的任意形状簇,需满足以下两个条件:
- 对于 $C$ 中的每个点 $x$,存在一个密度吸引子 $x^ $,使得 $f(x^ ) \geq \xi$,且 $x$ 被 $x^*$ 密度吸引。
- 对于 $X$ 中的任意两点 $u$ 和 $v$,存在一个密度吸引子序列 $(y_1, \ldots, y_p)$,使得 $u = y_1$,$y_p = v$,且 $f(y_i) \geq \xi$。
1.1 证明示例
设 $d$ 是 $\mathbb{R}^n$ 中的欧几里得度量,$x^ $ 是根据方波影响函数 $f_{\sigma, d}^{sq}$ 的密度吸
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



