1 主要思想
弱监督目标检测(WSOD)仅仅使用的是图像级别的标注从而实现解决目标检测问题,在过去几年中得到了一些研究者的关注,而当前存在的一些解决方法都存在自己的局限性,例如使用最广泛的MIL(多实例学习)算法非常容易陷入到局部最优值,因为MIL的学习策略是学习到的每个类别中最具有判别性的目标(使用分类分数最高的目标进行训练),则这些方法会缺少足够多的样本,因此模型的检测性能会大大下降,所以如何获得训练检测器所需要的目标实例样本尤其重要。而该文章也是真对该问题,提出了一种端到端的OIM(目标实例挖掘)算法,其主要是使用空间图和外观图中包含的信息传播来挖掘图片中所有可能存在的目标实例,而不需要额外的一些位置标注信息。其训练过程需要进行多次迭代,将图片中一些判别性没那么高的目标实例能够检测出来并重新用于训练。除此之外,作者也提出了一种和目标实例相关的reweighted loss,而该loss可以学习到每个实例的更大一部分,从而可以进一步提高检测器的性能。作者在本篇文章中的主要贡献可以总结如下:
(1)使用空间图和外观图在仅仅只有图片级别地标注情况下尽可能地挖掘出目标实例,从而在训练时能够得到更多样本,从而可以极大地CNN分类模型地提高检测性能;
(2)提出了一个对对象实例地重加权损失函数,该loss对不同地目标进行了加权,这样可以避免目标地局部信息,从而进一步提高CNN模型地检测准确率。
2 详细方法
2.1 相关工作
全监督目标检测算法已经能够达到较好的检测性能,但是这是建立在大量的人工标注数据上,这需要花费大量的标注时间,这就使得CNN目标检测模型