【每日一网】Day24:MS-CNN简单理解

MS CNN

算法背景

本文提出了一种多尺度的神经网络,用于快速的多尺度目标检测,作者将Faster RCNN进行多尺度化,从而提升了对小目标检测效果,在自然图像中,目标可以以不同的比例和大小出现,如图中黄色边看所示,单个的 感受野(如阴影区域)无法匹配目标的可变性。对于小物体,尤其是图的中心区域的物体,检测性能往往特别差

在这里插入图片描述

算法原理

作者提出了一种多尺度的CNN,该网络有两个子网络组成,分别用于提出Region proposal和精确的检测目标,为了改善目标大小和对应的感受野之间的不一致,使用多个输出层执行对象检测,每个输出层都负责识别特定比例范围内的对象,较低的的网络层(如conv3)具有较小的感受野,负责更好的匹配小目标,相反较高的图层(例如conv5)负责检测大目标,不同输出层的互补检测器组合到一起,形成一个强大的多尺度检测器。
在这里插入图片描述

作者还提出了使用特征上采样作为输入上采样的替代方法,这通过引入反卷积层,提高了 特征图的分辨率,从而使小物体能产生较大的区域的强烈相应,作者认为这是除了反卷积在分割和边缘检测之外的第一次利用于加速和改进检测。

在这里插入图片描述

多尺度RPN

在这里插入图片描述
对于多尺度目标检测,主要由如下的几种策略:
a)变换图像的输入尺度得到不同尺度的feature map,从而使得网络可以适配多种尺度的目标输入,因而有较高的性能,但是计算代价大。
(b)在固定的输入尺度与feature map上使用多个尺度的分类器,避免了带来较大的计算量,但是性能很一般。
(c)使用少量的尺度再得到这些尺度的分类结果
(d)对输入进行少量尺度的计算并通过插值去弥补缺失的特征图。已被证明可以在分类精度损失很小的情况下实现达到快的速度。
以上的几种方法由于CNN网络特征的复杂性,并没有在检测网络中采用。
(e)这里的方法和(a)比较相似,但它是对proposal区域进行变换来得到不同尺度的特征的,并不是对整幅图像。
(f)相同大小的多个模板集应用于所有feature map,这可能导致模板匹配的严重尺度不一致,该方法与(b)相似
(g)使用了单一的图像尺度输入,但是在不同分辨率的卷积图上进行分类,使得形成了一组可变大小的接受域,可以覆盖很大范围的目标大小。这也是论文采取的结构形式

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值