多视图数据中的联合知识发现:从CCA到GKMCCA
在处理多视图数据时,挖掘不同视图之间的共享信息和判别信息是一个重要的任务。本文将介绍从典型相关分析(Canonical Correlation Analysis,CCA)到图正则化核多视图典型相关分析(Graph-Regularized Kernel Multiview Canonical Correlation Analysis,GKMCCA)的一系列方法,以及它们在多视图数据处理中的应用。
1. 典型相关分析(CCA)
我们考虑有 $N$ 个共同源 ${\check{s} n \in \mathbb{R}^{\rho}} {n=1}^{N}$,以及由 $M$ 个中心化数据集 ${X_m \in \mathbb{R}^{D_m \times N}} {m=1}^{M}$ 表示的 $M$ 个视图,其中可能有 $\rho \ll \min_m {D_m} {m=1}^{M}$。为了简化表示,我们将 $N$ 个共同源向量和第 $m$ 个视图向量分别堆叠成数据矩阵 $\check{S} \in \mathbb{R}^{\rho \times N}$ 和 $X_m$ 的列。
1.1 标准 CCA
标准 CCA 适用于 $M = 2$ 的情况,它寻找两个子空间矩阵 $U_1 \in \mathbb{R}^{D_1 \times d}$ 和 $U_2 \in \mathbb{R}^{D_2 \times d}$($d \leq \rho$),使得两个视图在投影空间 $\mathbb{R}^d$ 中尽可能接近。这可以通过求解以下优化问题来实现:
[
\be
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



