深度鸡尾酒网络在多源领域自适应中的应用
1 引言
深度表示学习的最新进展显著提升了计算机视觉问题的最先进水平。这些进步主要得益于大规模标注数据集的存在,这些数据集为监督学习提供了广泛的标记示例。然而,当面临无监督领域自适应(Domain Adaptation, DA)时,仅提供源域中的标注示例,而在没有目标域标注数据的情况下完成任务(如视觉分类)变得极具挑战性。传统的领域自适应算法大多基于单一源域的前提,而在现实世界中,我们常常会遇到多个源域的情况,这促使了对多源领域自适应(Multi-source Domain Adaptation, MSDA)问题的关注。
MSDA旨在通过利用多个源域的数据,来提高目标域上的模型性能。与单源领域自适应相比,MSDA不仅面临领域偏移的问题,还需应对源域之间的类别不一致。因此,如何有效地融合多个源域的信息,同时避免负面迁移,成为了MSDA的关键挑战。
2 问题设置
2.1 原始MSDA迁移场景
在多源迁移方面,有M个不同的源分布,分别用{Pj(x, y)}Mj=1表示,这些分布中分别抽取了带标签的源域图像{(Xj, Yj)}Mj=1,其中Xj={xj,i}Nji=1代表来自第j个源的总共Nj张图像,Yj={yj,i}Nji=