聚类中的相异度、度量与超度量
1. 引言
聚类的目标是将相似的对象归为一组,同时确保不相似的对象分属不同的组。相异度是评估对象之间差异程度的数学工具。本文将介绍相异度空间和相似度的概念,详细讨论满足特定性质的特殊相异度,如度量和超度量,还会探讨集合之间的相似度和相异度及其特殊性质,同时介绍n维空间中的重要度量和范数,尤其关注超度量空间及其与层次聚类的关系。
2. 相异度空间
2.1 相异度的定义
相异度是定义在集合 $S$ 上的函数 $d : S × S \to \mathbb{R}_{\geq 0}$,满足 $d(x, x) = 0$ 且 $d(x, y) = d(y, x)$ 对于任意 $x, y \in S$。若 $d(x, y) = 0$ 意味着 $x = y$,则称 $d$ 为确定相异度。相异度的集合记为 $DS$,确定相异度的集合记为 $DDS$。$(S, d)$ 构成相异度空间。若 $d$ 和 $d’$ 是 $S$ 上的相异度,当 $d(x, y) \leq d’(x, y)$ 对于任意 $x, y \in S$ 时,记为 $d \leq d’$。
2.2 扩展相异度
扩展相异度的定义与相异度类似,只是取值范围为 $\mathbb{R} {\geq 0} \cup {\infty}$。若后续定义的各类相异度取值范围是 $\mathbb{R} {\geq 0} \cup {\infty}$,则会加上“扩展”这一属性。
2.3 相异度空间的表示
有限相异度空间 $(S, d)$(其中 $S = {x_1, \ldots, x_n}$)
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



