论文的题目是《Exploit All the Layers: Fast and Accurate CNN Object Detector with Scale Dependent Pooling and Cascaded Rejection Classifiers》。
(本篇论文主要在Fast R-CNN基础上提出了两个创新:尺度相关的池化SDP;级联拒绝分类器CRC)
1.论文所提出的利用卷积网络的快速而精确的目标检测方法的框架结构:
o 利用卷积网络每一层的特征来拒绝负的proposals;
o 对没有被拒绝(Surviving proposals)的proposals使用论文提出的尺度相关池化SDP进行evaluate。
2.尺度相关池化(SDP)
(1)尺度相关池化模型结构图:
(2)SDP根据每个Proposal的尺寸,从对应的conv feature map上池化特征,如图所示,对于Small ROI,从Conv3特征图上池化ROI的feature patch,对于Mid ROI,从Conv4特征图上池化特征;对于Large ROI,从Conv5特征图上池化特征。
(3)SDP模型的三个分支是Conv3,Conv4,Conv5,每个分支包含2个后续的fc层,ReLU激活及Dropout层计算bbox和得分,主要对小尺寸的物体在卷积图比较大时能保存更多的信息。
(4)输入的object proposals首先根据它们的高度分成3组,然后输入到相应的ROI pooling层,从相应的卷积层输出中池化特征。
(5)实验中 ;
。
3.级联拒绝分类器(CRC)
总体思想:每个尺度组训练一个级联拒绝分类器,每个拒绝分类器有50个弱分类器组成,boosting分类器累积弱分类器的响应。
(1)级联拒绝分类器结构图:
(2)每个尺度组学习一个单独的拒绝分类器
o 假设有个proposals属于尺度组
,
,
是相应的标记,如果包含一个目标则
,否则为0。
o 对于,用SDP训练的CNN模型的卷积层池化特征,得到
(
维,此处m=7,c是卷积层的通道数);
o 这样就可以得到训练集
o 每个拒绝分类器有50个弱分类器;
为了不增加训红更强拒绝分类器的计算,使用上一级的弱分类器初始化下一级的弱分类器。
4.实验
(1)Datasets(实验数据集):KITTI检测benchmark,PASCAL VOC2007,Inner-city dataset;
(2)Network(实验网络):CNN模型是在Imagenet数据上预训练的VGG16,3个SDP分支,
o
o 对SDP_3使用的是2048维的fc层;
(3)Training parameters(训练参数)
o 每个图像,每个尺度组随机采样128个positive proposals,128个negative proposals;
(4)Box proposals:采用EdgeBox和ACF生成proposals。
(5)实验效果:
(级联拒绝分类器的训练构成及训练部分不是很理解,但应该是每个尺度组训练一个级联拒绝分类器的)