基于典型相关性分析的多视图学习方法——典型相关性分析(Canonical Correlation Analysis, CCA)

典型相关性分析(Canonical Correlation Analysis, CCA)是经典的挖掘视图相关 性的多视图子空间学习方法[38],主要是计算两视图特征的最大线性投影,使得在投影空间中,两视图特征的相关性最大

但 CCA 存在两个局限:

  • 第一,只适用于两视图学习;
  • 第二,只能进行线性运算,无法满足两视图特征的非线性关系运算。

基本概念

典型相关性分析(Canonical Correlation Analysis, CCA)是一种统计方法,用于量化和理解两组变量之间的线性关系

CCA旨在找到两组变量内的线性组合,使得这些组合之间的相关性最大化。这种方法特别适用于探索不同数据源或测量方式之间的潜在联系。

CCA的基本目标是在两组随机变量 X\mathbf{X}XY\mathbf{Y}Y 之间寻找一对线性组合,使得它们之间的相关性最大化。这里,X\mathbf{X}XY\mathbf{Y}Y 可以是任意两个数据集,例如,一个人的身高和体重数据集和这个人跑步和跳远的能力数据集。

CCA的主要公式和解释如下:

  • 给定两组随机变量向量 X\mathbf{X}XY\mathbf{Y}Y,其中X∈Rp\mathbf{X}\in\mathbb{R}^{p}XRpY∈Rq\mathbf{Y}\in\mathbb{R}^{q}YRq

  • CCA试图找到向量 a∈Rp\mathbf{a}\in\mathbb{R}^{p}aRpb∈Rq\mathbf{b}\in\mathbb{R}^{q}bRq使得新的变量 U=a′XU=\mathbf{a}'\mathbf{X}U=aXV=b′YV=\mathbf{b}'\mathbf{Y}V=bY 之间的相关性最大

  • 这里的 a′\mathbf{a}'ab′\mathbf{b}'b 分别表示向量 a\mathbf{a}ab\mathbf{b}b转置。

CCA的优化目标是:

ρ=corr(U,V)=Cov(U,V)Var(U)Var(V)\rho = \text{corr}(U, V) = \frac{\text{Cov}(U, V)}{\sqrt{\text{Var}(U)\text{Var}(V)}}ρ=corr(U,V)=Var(U)Var(V)Cov(U,V)

其中,

  • ρ\rhoρ典型相关系数,表示 UUUVVV 之间的相关性。
  • Cov(U,V)\text{Cov}(U, V)Cov(U,V)UUUVVV协方差。
  • Var(U)\text{Var}(U)Var(U)Var(V)\text{Var}(V)Var(V) 分别是 UUUVVV方差。

为了简化这个目标,CCA通过求解广义特征值问题来实现。具体来说,CCA试图最大化如下表达式:

max⁡a,ba′ΣXYba′ΣXXa⋅b′ΣYYb \max_{\mathbf{a}, \mathbf{b}} \frac{\mathbf{a}'\Sigma_{XY}\mathbf{b}}{\sqrt{\mathbf{a}'\Sigma_{XX}\mathbf{a} \cdot \mathbf{b}'\Sigma_{YY}\mathbf{b}}} a,bmaxaΣXXabΣYYbaΣXYb

其中,

  • ΣXX\Sigma_{XX}ΣXXX\mathbf{X}X协方差矩阵。
  • ΣYY\Sigma_{YY}ΣYYY\mathbf{Y}Y协方差矩阵。
  • ΣXY\Sigma_{XY}ΣXYΣYX\Sigma_{YX}ΣYX 分别是 X\mathbf{X}XY\mathbf{Y}Y 之间的交叉协方差矩阵。

然而,为了简化计算,通常CCA通过求解以下广义特征值问题来实现:

ΣXYb=λΣYYb \Sigma_{XY}\mathbf{b} = \lambda\Sigma_{YY}\mathbf{b} ΣXYb=λΣYYb
ΣYXa=λΣXXa \Sigma_{YX}\mathbf{a} = \lambda\Sigma_{XX}\mathbf{a}ΣYXa=λΣXXa

其中,

  • λ\lambdaλ 是特征值。
  • a\mathbf{a}ab\mathbf{b}b 分别是与最大特征值对应的特征向量,这些向量给出最优的线性组合 UUUVVV

CCA的一个关键假设是协方差矩阵 ΣYY\Sigma_{YY}ΣYYΣXX\Sigma_{XX}ΣXX非奇异的。如果矩阵奇异,需要额外的技术来处理这个问题。

在多视图学习中,CCA被用来寻找多个视图之间的线性投影,使得投影后的数据在新的低维空间中保留了视图间的相关性。这种技术在跨模态检索、多视图特征融合等领域有广泛的应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不易撞的网名

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值