论文提要“Scalable Object Detection using Deep Neural Networks”

本文深入探讨了DeepMultiBox方法,一种基于DNN的目标检测技术,它通过生成少量与目标类别无关的候选框来改进检测性能。该方法将目标检测视为多个bounding box的回归问题,网络在输出时提供每个bounding box的置信度分数,并将其作为训练过程的一部分。通过以无关类别的模式训练目标框预测器,DeepMultiBox实现了对未知目标类别的泛化能力。文中详细阐述了方法的三个主要贡献、训练策略和实验结果,包括在VOC2010和ILSVRC2012数据集上的表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

与之前主流检测方法DPM不同,论文提出了一种名为“DeepMultiBox”的方法产生比较少量的目标候选框,这些候选框是使用DNN(Deep Neural Network)生成的与目标类别无关的区域。
1.主要贡献:
1)将目标检测定义为几个bounding box的回归问题,网络在输出bounding box时给出每个bounding bo包含目标的置信度分数
2)将训练bounding box predictors作为网络训练的一部分,根据预测位置和ground truth的值更新box坐标及它的置信水平
3)以无关类别的模式训练目标框预测器,该检测器可泛化到未包含的目标类别

2.方法描述:
使用DNN产生一定数量的bounding box及每个box包含目标的置信度水平,将第i个object box的坐标liR4及其置信度水平ci[0,1]编码为网络最后一层节点的值。
训练目标:假设对于一个训练样本,有M个bounding box,即gj,j{1,...,M},预测出的K个框要远大于M个ground truth,因此需要对与ground truth匹配程度比较高的预测框进行优化,并且降低余下框的置信度。
论文构造了一个分配的问题,如果第i个预测被分配给第j个真是目标,则xij=1,分配的目标函数为:
这里写图片描述
同时需要根据分配x优化框的置信度,即置信度的loss:
这里写图片描述
最终loss目标函数为:
这里写图片描述
优化方法:使用bp对l,c求偏导
训练细节:使用prior matching,即对ground truth的location进行聚类得到K个典型的聚类中心作为priors,之后用K个priors进行辅助匹配。

3.实验结果
VOC2010训练,复杂场景下20类目标,训练正样本:10million crops>0.5Jaccard重叠相似度,负样本:20million crops<0.2Jaccard重叠相似度,VOC2007测试结果,mAP为0.29
ILSVRC2012,1000类目标,结果如下,第三名
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值