深度鸡尾酒网络在多源领域自适应中的应用
1 引言
深度表示学习的最新进展显著提升了计算机视觉问题的最先进水平。这些进步主要得益于大规模标注数据集的存在,这些数据集为监督学习提供了广泛的标记示例。然而,当面临无监督领域自适应(Domain Adaptation, DA)时,仅提供源域中的标注示例,而在没有目标域标注数据的情况下完成任务(如视觉分类)变得极具挑战性。传统的领域自适应算法大多基于单一源域的前提,而在现实世界中,我们常常会遇到多个源域的情况,这促使了对多源领域自适应(Multi-source Domain Adaptation, MSDA)问题的关注。
MSDA旨在通过利用多个源域的数据,来提高目标域上的模型性能。与单源领域自适应相比,MSDA不仅面临领域偏移的问题,还需应对源域之间的类别不一致。因此,如何有效地融合多个源域的信息,同时避免负面迁移,成为了MSDA的关键挑战。
2 问题设置
2.1 原始MSDA迁移场景
在多源迁移方面,有M个不同的源分布,分别用{Pj(x, y)}Mj=1表示,这些分布中分别抽取了带标签的源域图像{(Xj, Yj)}Mj=1,其中Xj={xj,i}Nji=1代表来自第j个源的总共Nj张图像,Yj={yj,i}Nji=1对应它们的标签。此外,存在一个目标分布Pt(x, y),其中目标图像集X(t)={x(t)i}N(t)i=1是从该分布中抽取的,但没有标签观察Y(t)。这M+1个域集被当作一个训练集集成处理,测试集(Xtest, Ytest)={xtesti, ytesti}Ntesti=1是从目标域中抽取的。
2.2 类别偏移
在普通的MSDA设置
超级会员免费看
订阅专栏 解锁全文
711

被折叠的 条评论
为什么被折叠?



