协作多视图聚类的最优传输框架
1. 引言
多视图聚类是一种重要的数据处理技术,它可以将多视图数据进行有效聚类。本文将多视图聚类问题转化为最优传输问题,并提出基于协作学习的多视图聚类新框架。
2. 动机
多视图聚类可分为局部步骤和全局步骤。局部步骤旨在对每个视图中的数据进行聚类,全局步骤则倾向于聚合这些信息(聚类中心)以达成共识并同时表示所有视图。
考虑具有 $r$ 个视图的数据集 $X = {X_1, \cdots, X_r}$,其中 $X_v = {x_v^1, \cdots, x_v^n}$ 是由 $n$ 个实例组成的第 $v$ 个视图。现有的统一视图或达成共识的方法,通常试图最大化某个目标函数,该函数结合了由某些算法给出的基本分区 $H = {h_1, h_2, \cdots, h_r}$ 以找到共识分区 $h$,其中效用函数 $U$ 的选择非常重要。共识函数为:
$\Phi(h, H) = \sum_{i = 1}^{r} w_i U(h, h_i)$
通过使用不同的距离(如 Mirkin 距离),可以将此问题转化为最小化问题而不改变其本质。在某些假设下,共识问题等价于 K-means 问题。
表 1:符号说明
| 符号 | 说明 |
|---|---|
| $X$ | 全局数据,$x_i \in R^d$ |
| $\mu$ | 分布 |
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



