1、简介
随着深度学习在物体检测方面的快速发展,但目前的物体检测技术主要的面向对象是真实场景下的图像,但对于像水彩画这种非真实场景下的物体检测技术来说,其一般很难获取大量的带有标注的数据集,因此问题就变得比较棘手。为解决这一问题,作者提出了基于域适应的弱监督学习策略,其可以描述为(1)、选取一个带有实例级标注的源域数据;(2)、仅有图像级标注的目标域数据;(3)、目标域数据的类别是源域数据类别的全集或子集。我们的任务就是在源域拥有充足的实例级标注的数据但目标域仅有少量图像级标注的目标域数据的情况下尽可能准确的完成实现对目标域数据的物体检测。这个任务的难点主要在于目标域没有实例级的标注,因此无法直接利用目标数据集对基于源数据集训练的模型进行微调。针对这一问题,作者提出了两种解决方法,(1)、域迁移(domain transform,DT),即利用图像转换技术,如CycleGAN将源域数据转换为和目标数据相似的带有实例级的图像。(2)利用伪标记(pseudo-labeling,PL)来对目标域数据产生伪实例级标注。两种方法如图1所示:
图1
为验证该策略的有效性,作者分别采集并手工标注了三个分别具有实例级标注的目标数据集:Clipart1k,Watercolor2k,Comic2k。数据集及代码见:https://naoto0804.github.io/cross_domain_detection/
2、数据集
小编认为,作者这篇文章最大的贡献之处不仅仅在于其提出的基于弱监督学习的目标检测的方法,更重要的是作者所建立的数据集,为将来这方面工作的进行提供了数据集支持。