无监督领域自适应的重加权对抗适应网络(RAAN)
1. 引言
深度网络在计算机视觉的监督学习应用中表现出色,但它们需要大量的标注数据,这在实际操作中往往难以实现。此外,训练好的模型难以泛化到新的数据集,尤其是当这些新数据集与训练数据集存在分布差异时。领域自适应(Domain Adaptation, DA)问题在这种情况下被提出,旨在解决目标域(少量标签可用)和源域(标注良好的标签)之间的数据分布不同时,源域中的特征和分类器不能直接迁移到目标域的问题。无监督领域自适应(Unsupervised Domain Adaptation, UDA)方法旨在解决目标域无标签信息情况下的分布匹配问题,使得从源域训练的分类器可以转移到目标域。
2. 领域自适应问题
UDA问题的核心挑战在于目标域与源域数据分布的不同,这种现象被称为领域偏移(domain shift)。当目标域没有标签可用,且源模型需要在未标记的目标数据上进行良好泛化时,这个问题尤为具有挑战性。领域适应的高层次思想有两个方面:
- 学习从目标域到源域的映射 :通过适应映射 ( g ) 将目标域数据映射到源域,然后将学习到的源域模型 ( f ) 与适应映射 ( f \circ g ) 组合,以获得目标域的模型。
- 学习源域和目标域共享的潜在空间 :在该潜在空间中,源和目标表示是不可区分的,可以使用简单的模型对源域进行回归。这种潜在空间有时被称为领域不可知潜在空间(domain-agnostic latent space)。