FPN, CVPR17。
核心创新点是feature pyramid。传统方法应对尺度变化, 做image pyramid,这样很费时。 其实图像金字塔的作用可以用CNN前向过程中产生分辨率逐渐降低的feature pyramid来代替。
这样的想法很自然, 利用feature pyramid可以共享计算, 这样增加的计算量是很小的。 前面也有人尝试这么做,见下图:
(b)是一般检测模型的方法, 只在最上面的特征层做后面的检测(classification&location)。这样信息利用的不充分。
(c)是SSD的方法, 在后面的不同特征层做检测。但是SSD没有利用靠前的高分辨率特征,但是这些特征对检测小物体是很有益的。
(d)是文中提出的方法。左边是bottom-up过程,也就是CNN前向过程, 右边是top-down过程, 每个尺度的特征是更小尺度特征上采样和bottom-up中同尺度特征的融合。然后分别在每个尺度的特征上做后续检测。
other details:
a. 和SSD类似, 结合FPN的faster rcnn,其anchors按尺度分配给不同feature pyramid的不同层;
b. feature pyramid各层后续的head参数共享。