[cvpr2017]Learning an Invariant Hilbert Space for Domain Adaptation

最新推荐文章于 2025-09-08 18:27:11 发布

翻译最新推荐文章于 2025-09-08 18:27:11 发布 · 1.2k 阅读

文章标签：

10 篇文章

订阅专栏

本文介绍了一种利用马氏距离和黎曼几何概念进行无监督和半监督域适配的方法。通过学习一个不变潜在空间(ILS)，该方法旨在减少源域与目标域之间的差异，同时提高区分能力。

Introduction

本文适用于半监督和无监督形式的domain adaptation
作者尝试开发一个几何解决方案，通过利用黎曼几何的概念学习潜在空间（latent space）的投影和马氏距离。
作者建议从source domain和target domain沿着相关联的映射学习潜在空间（latent space）的结构，以解决无监督和半监督DA的两个问题。
为此，作何提出在latent space中最大化discrimination power（区分source domain和target domain）的概念。同时，这个latent space也要能够做到最小化source domain和target domain的某个统计量之间的差异
特别地，作者利用矩阵流形上的黎曼几何和优化技术来解决问题。流形科普1；流形科普2（简而言之就是用非线性方式将数据从高维降到低维的，并且保持拓扑结构不变，对机器学习而言，流形学习就是一个提取特征的过程）

作者建议学习一个 Invariant Latent Space (ILS)来减少source domain和target domain之间的discrepancy（差异）。
定义：
ILS定义了将source domain和target domain的数据映射到p维lantent space空间的变换 $W_s$ 和 $W_t$ ：
latent space用马氏距离 $M$ 作为度量：
cost function:

L=Ld+λLu
- $L_d$ （Discriminative）：source domain和target domain的相异度（dissimilarity）
- $L_u$ （Unsupervised）：衡量source domain和target domain之间差异的一个统计量

Ld 是为了使得latent space能够：
- 最小化latent space中来自同一个分类的样本的不相似度
- 最大化latent space中来自不同分类的样本的不相似度
定义来自latent space中的样本 $Z$ （这里允许半监督）：
度量M要使得相似的pair距离小，不相似的pair距离大
- 当 $\beta \rightarrow \infty$ 时， $l_\beta$ 趋近hinge-loss函数， $l_\beta$ 科技看成hinge-loss函数的平滑可导的变体，主要是为了便于优化和避免陷入单一样本点
- 该公式中， $x^tMx$ 计算了 $z_{1,k}$ 与 $z_{2,k}$ 的马氏距离（根据原始公式，这个 $M$ 理应是 $(z_{1,k}-z_{2,k})$ 的协方差矩阵的逆矩阵，但是这里并不是，我在想为什么）
- pairs中 $z_{1,k}$ 与 $z_{2,k}$ 的循序与 $l_\beta$ 的大小无关
- $y_k=1$ 时也就是相似的时候， $l_\beta$ 随 $z_{1,k}$ 与 $z_{2,k}$ 的马氏距离的增加而增加， $y_k=-1$ 时也就是不相似的时候， $l_\beta$ 随 $z_{1,k}$ 与 $z_{2,k}$ 的马氏距离而减少
- 使用Stein divergence（？）将 $M$ 正则化（regularize）