重新思考协作聚类:稳定性、新颖性与一致性分析
1. 从常规聚类到协作聚类
多视图聚类,特别是协作聚类,可以被视为一种特定的受限聚类形式。常规聚类和多视图分区在理论上是等价的,因为存在一个双射应用 $\nu : N_J \to N$,使得 $\nu \circ C$ 是 $X \subseteq X$ 的一个聚类。
1.1 多视图聚类距离与稳定性
在分析协作聚类的理论性质时,首先需要定义用于测量总空间 $X = X_1 \times \cdots \times X_J$ 上产生的聚类之间差异的相关聚类距离。虽然理论上任何满足定义条件的距离都适用,但考虑更适应空间分解特性的距离会更有意义。
- 规范多视图聚类距离 :设 $X = X_1 \times \cdots \times X_J$ 是一个域,$d_j$ 是 $X_j$ 上的聚类距离。定义函数 $d : P \times S \times S \to [0, 1]$ 为 $d_P(C_1, C_2) = \frac{1}{J} \sum_{j = 1}^{J} d_j^{P_j}(C_j^1, C_j^2)$,则 $d$ 定义了 $X$ 上的一个聚类距离,称为规范多视图聚类距离。其证明基于 $d_j$ 的线性性和局部聚类距离的性质。在这个定义中,线性组合的系数均匀地等于 $\frac{1}{J}$,目的是给予所有视图相同的重要性,但选择非均匀权重不会改变后续结果。
- 多视图稳定性 :当使用规范多视图聚类距离时,协作或多视图算法在总空间上的稳定性有简单的解释。多视图算法 $A$ 对于规范多视图聚类距离
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



