1、摘要
Feature pyramids are a basic component in recognition systems for detecting objects at diferent scales.But recent deep learning object detectors have avoided pyramid representations, in part because they are compute and memory intensive.In this paper, we exploit the inherent multi-scale, pyramidal hierarchy of deep convolutional networks to construct feature pyramids with marginal extra cost.【好用但是开销大,paper提出一个方法来少开销的使用】
2、简介
一些使用pyramid方法
蓝色框代表feature map,框的线条越粗,其语义表达能力越强。我们可以获取输入图像的不同的尺寸,并在不同尺度上提取特征(如:SIFT、HOG),然后进行目标的预测。【参考】
- (a)用图片金字塔生成特征金字塔,在非深度的方法中比较常见,通过将图片放缩到不同的大小,这样一些类似于固定滑窗的方法就可以检测到不同大小的物体,这个内存和时间上有巨大的开销。因为CNN提取特征十分的耗时。
- (b)只在特征最上层进行预测【(b)展示了现在深度学习方法的常用策略,用深度网络提取feature