multiBox论文:
Scalable Object Detection using Deep Neural Networks
网络目的:
生成多个大小不一、不确定类别但包含目标的bounding boxes。可以理解为在一副图像基础上生成多个大小不一的Region proposals。
作者利用DNN,输出一定数量的bounding boxes,以及每个box包含目标的置信度。
网络创新点:
网络创新点主要有三点:
1、将目标检测作为一个回归问题,预测多个bounding boxes的坐标,并预测出每个box的置信度(用于判断box包含目标可能性的大小);
2、利用分配问题的思想构建损失函数,通过反向传递优化参数;
3、使用了一种无类别的方式去训练目标box预测器。
网络预测信息:
网络最终预测的信息为bounding boxes和confidence(置信度):
bounding boxes:以左上、右下两个坐标点作为每个box的4个节点值,且利用图像的维度将这4个值进行归一化处理,通过网络最后一个隐藏层去预测。
confidence(置信度):用于判断是否包含目标的置信度分数单独作为一个节点值,利用网络最后一个隐藏层去预测然后通过sigmoid函数计算获得。
网络训练过程:
损失函数:

其

本文介绍了一种基于深度学习的多尺度对象检测方法multiBox,它通过回归问题预测boundingboxes及其置信度。创新点在于将目标检测视为回归任务,采用分配问题构建损失函数,并采用无类别方式训练。该方法有助于生成高质量的Regionproposals,提升后续目标检测的精度。
最低0.47元/天 解锁文章
2517

被折叠的 条评论
为什么被折叠?



