跨数据集分析与特定领域均值分类器的域适应研究
1. 跨数据集分析的背景与挑战
在机器学习领域,尤其是计算机视觉应用中,数据的多样性和复杂性带来了诸多挑战。大量的数据需要能够高效处理它们的方法。每个类别有大量图像且类内差异较大时,虽可减少对应边缘数据分布之间的不匹配,但两个数据集中类别之间的关系仍可能不同,这就需要能够处理数据条件分布差异的判别方法。
在图像数据集的应用中,现有图像集合用于目标分类时,存在特定特征,常阻碍直接的跨数据集泛化。即使在两个领域提取相同特征,相机、图像分辨率、光照、背景、视角和后处理等因素的变化导致的域转移,会强烈影响特征分布,从而违背在源域训练的分类器的假设。因此,在学习过程中推断能很好适应测试数据的模型至关重要。
2. 域适应问题的提出与目标
域适应旨在解决目标域训练数据少而源域训练数据丰富的分类器学习问题。通过利用一个或多个相关源域的标记数据,为目标域的未见数据学习分类器。但源域和目标域虽相关却不相同,直接应用源域学习的模型在目标域的性能往往很差。
3. 相关工作回顾
域适应的相关文献众多。与本文最相关的工作聚焦于变换特征空间以使各域更接近,这类方法可进一步分为:
- 无监督变换方法 :通常基于PCA投影,如一些基于子空间的域适应方法。
- 基于度量学习的方法 :利用源域和目标域的类别标签学习特征空间的变换,使同一类别的实例在新空间中彼此更接近。例如Domain Invariant Projections (DIP) 不使用类别标签学习变换矩阵,而扩展的DIP+CC则寻找鼓励相同类别标签样
超级会员免费看
订阅专栏 解锁全文
18万+

被折叠的 条评论
为什么被折叠?



