基于耦合视觉与语义嵌入空间的零样本图像分类
1 耦合字典学习
1.1 算法概述
耦合字典学习旨在通过联合稀疏编码矩阵 A 来耦合视觉特征 X 和语义特征 Z 的字典学习问题,同时强制字典 Dz 成为 Z′ 的稀疏化字典,稀疏码为 B。该优化问题在 (Dx, Dz) 和 (A, B) 上是双凸的,但在所有变量上是非凸的。因此,采用交替更新 Dx 和 Dz 的方法来寻找局部最优解。
1.2 算法步骤
以下是耦合字典学习的算法步骤:
Algorithm 1 Coupled Dictionary Learning ({X, Z, Z′}, λ, r, itr)
1: Dx ← RandomMatrix(p, r), Dz ← RandomMatrix(q, r)
2: Dz ← update(Dx, {X, Z, Z′}, λ) # Eq. 3.3
3: Dx ← update(Dz, {Z}, λ) # Eq. 3.4
具体来说,首先随机初始化字典 Dx 和 Dz,然后交替更新它们:
- 更新 Dz :求解如下优化问题:
[
\min_{A,Dx} |X - DxA| 2^2 + \lambda |A|_1 + \beta |Dx|_2^2
]
通过交替求解 A 的 LASSO 问题和对 Dx 进行梯度下降来更新。为了降低计算复杂度,采用随机梯度下降框架,每次迭代从 X 和 A 中随机选取一批行。
- 更新
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



