通过图像到图像的翻译实现领域自适应
1. 引言
在计算机视觉中,深度学习的领域自适应是一个重要课题,尤其是在处理标记数据稀缺或不存在的情况下。无监督领域自适应(UDA)旨在利用来自标记丰富的源域的知识,来提升模型在未标记的目标域上的表现。为了实现这一目标,研究者们探索了多种方法,其中一种极具潜力的方法是通过图像到图像的翻译(I2I)来缩小源域和目标域之间的差距。
2. 无监督领域自适应框架
本章介绍了一个用于无监督领域自适应的框架,该框架结合了图像到图像的翻译技术。这个框架不仅能够减少源域和目标域之间的差异,还能显著提高模型在目标域上的性能。该框架的设计灵感来源于以下几个关键概念:
- 领域不可知特征提取 :确保从源域和目标域提取的特征分布尽可能接近。
- 具有循环一致性的领域特定重建 :确保特征能够被解码回源和目标域,同时保持信息完整性。
- 从未知特征进行标签预测 :通过学习领域不可知的潜在空间,实现从源域到目标域的有效迁移。
2.1 系统架构
框架的系统架构如图7.3所示,主要包括三个部分:
- 领域不可知特征提取 :通过深度卷积网络(DCNN)将源域和目标域的图像映射到一个共享的潜在空间。在这个空间中,源和目标域的特征分布尽可能接近。
- 具有循环一致性的领域特定重建 :通过编码器-解码器结构,确保特征可以
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



