论文笔记:Weakly Supervised Deep Detection Networks

本文介绍了Weakly Supervised Deep Detection Networks(WSDDN),一种使用预训练CNN解决仅使用image-level标签的大规模物体检测问题的方法。通过在CNN中引入Spatial Pyramid Pooling Layer,并采用双数据流结构分别进行识别和检测任务,实现弱监督学习。实验结果显示,该方法在PASCAL VOC训练集上表现出色,超越了当时的状态-of-the-art技术。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Weakly Supervised Deep Detection Networks

摘要:本文主要解决了大规模image-level的分类问题,可同时解决区域选择和分类问题。作为拖欠训练器来训练。

  1. 引言
    弱监督学习非常重要主要是由于以下两个原因,其一,图片理解的主要目的在于学习整体的复杂视觉环境(ImageNet比赛);其二,CNN训练数据缺乏。因此,如果能够用上层信息来学习复杂的内容能够极大地减小数据标注花费的时间和精力。用于图像分类的CNN可能已经包含有关物体检测的很多含蓄的不易被发现的信息。本文主要提出了一个新型的end-to-end方法使用预训练的CNN进行弱监督物体检测。(WSDDN)
    主要方法:第一步提取region-level特征,通过在卷积层最顶端插入spatial pyramid pooling layer;然后网络被分成两个数据流从region-level特征后面开始。 第一个数据流跟每个独立区域的类别得分有关 ,进行识别的任务,,第二个数据流,通过计算各个区域概率贡献来进行对比,从而确定出包含有图片中最显著信息的region,这个叫做检测。
    然后把这两个数据流结合起来预测image的类别。我们仅仅使用image-level labels,region proposals还有back propagation在现有模型构架上进行fine-tuning。在数据集PASCAL VOC training set上面的训练结果最好。

  2. 方法
    这里写图片描述<

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值