论文题目:《Transfer Adaptation Learning: A Decade Survey》
论文作者:Lei Zhang
论文链接:http://cn.arxiv.org/pdf/1903.04687.pdf
介绍
在很多实际的情况中, 源域(source domain)和目标域(target domain)之间存在:
- 分布不匹配(distribution mismatch)
- 领域偏移(domain shift)
独立同分布(independent identical distribution, i.i.d)的假设不再满足!
迁移学习(transfer learning)假设源域与目标域拥有不同的联合概率分布
\[ P(X_{source}, Y_{source}) \neq P(X_{target}, Y_{target}) \]领域自适应(domain adaptation)假设源域与目标域拥有不同的边缘概率分布, 但拥有相同的条件概率分布
\[ P(X_{source}) \neq P(X_{target}), P(Y_{source} | X_{source}) = P(Y_{target} | X_{target}) \]
实例权重调整自适应
当训练集和测试集来自不同分布时, 这通常被称为采样选择偏差(sample selection bias)或者协方差偏移(covariant shift).
实例权重调整方法旨在通过非参数方式对跨域特征分布匹配直接推断出重采样的权重.
基于直觉的权重调整
直接对原始数据进行权重调整.
首次提出于NLP领域1, 主要的方法有著名的TrAdaBoost
2.
基于核映射的权重调整
将原始数据映射到高维空间(如,再生核希尔伯特空间RKHS)中进行权重调整.
分布匹配
主要思想是通过重新采样源数据的权重来匹配再生核希尔伯特空间中源数据和目标数据之间的均值.
主要有两种非参数统计量来衡量分布差异:
- 核均值匹配(kernel mean matching, KMM)
\[ \begin{array}{l} {\min \limits_{\beta}\left\|E_{x^{\prime} \sim P_{r}^{\prime}}\left[\Phi\left(x^{\prime}\right)\right]-E_{x \sim P_{r}}[\beta(x) \Phi(x)]\right\|} \\ {\text {s.t.} \quad \beta(x) \geq 0, E_{x \sim P_{r}}[\beta(x)]=1} \end{array} \]
Huang等人3首次提出通过调整源样本的\(\beta\)权重系数, 使得带权源样本和目标样本的KMM最小.
\[ d_{\mathcal{H}}^{2}\left(\mathcal{D}_{s}, \mathcal{D}_{t}\right)=\left\|\frac{1}{M} \sum_{i=1}^{M} \phi\left(x_{i}^{s}\right)-\frac{1}{N} \sum_{j=1}^{N} \phi\left(x_{j}^{t}\right)\right\|_{\mathcal{H}}^{2} \]
weighted MMD
6方法考虑了类别权重偏差.
样本选择
主要方法有基于k-means聚类的KMapWeighted
7, 基于MMD和\(\ell_{2,1}\)-norm的TJM
8等.
协同训练
主要思想是假设数据集被表征为两个不同的视角, 使两个分类器独立地从每个视角中进行学习.
特征自适应
特征自适应方法旨在寻找多源数据(multiple sources)的共同特征表示.
基于特征子空间
该方法假设数据可以被低维线性子空间进行表示, 即低维的格拉斯曼流形(Grassmann manifold)被嵌入到高维数据中.
通常用PCA方法来构造该流形, 使得源域和目标域可以看成流形上的两个点, 并得到两者的测地线距离(geodesic flow).
基于流形的方法有
SGF
11和GFK