Weakly Supervised Deep Detection Networks
摘要:本文主要解决了大规模image-level的分类问题,可同时解决区域选择和分类问题。作为拖欠训练器来训练。
引言
弱监督学习非常重要主要是由于以下两个原因,其一,图片理解的主要目的在于学习整体的复杂视觉环境(ImageNet比赛);其二,CNN训练数据缺乏。因此,如果能够用上层信息来学习复杂的内容能够极大地减小数据标注花费的时间和精力。用于图像分类的CNN可能已经包含有关物体检测的很多含蓄的不易被发现的信息。本文主要提出了一个新型的end-to-end方法使用预训练的CNN进行弱监督物体检测。(WSDDN)
主要方法:第一步提取region-level特征,通过在卷积层最顶端插入spatial pyramid pooling layer;然后网络被分成两个数据流从region-level特征后面开始。 第一个数据流跟每个独立区域的类别得分有关 ,进行识别的任务,,第二个数据流,通过计算各个区域概率贡献来进行对比,从而确定出包含有图片中最显著信息的region,这个叫做检测。
然后把这两个数据流结合起来预测image的类别。我们仅仅使用image-level labels,region proposals还有back propagation在现有模型构架上进行fine-tuning。在数据集PASCAL VOC training set上面的训练结果最好。方法
<