《Feature Pyramid Networks for Object Detection》读论文计划-day1
今天读了两篇论文,分别是FPN与BiFPN的论文,论文地址见引用2。
首先需要知道的是,检测算法的结构一般可以分为backbone、neck、head三部分。
- backbone用于提取初级特征
- neck用于融合高级语义特征
- head编解码,实现分类与回归
FPN与其他模型
FPN(Feature Pyramid Networks for Object Detection,CVPR 2017)属于neck部分的改进、用于构建高级语义特征,融合多尺度特征,扩大感受野。
金字塔的概念,不是KaimingHe首先定义的,在很久之前就有相关论述,这一点在论文中有提及,FPN所做的改进可以由如下图片进行说明:
(a)使用图像金字塔构建特征金字塔。特征是在每个图像尺度上独立计算的,速度较慢,应该是最初的金字塔模型概念。
(b) 方法b选择仅使用单一尺度特征来进行更快的检测。仅输出一个尺度的预测。
(c)方法c是重用由 ConvNet计算的金字塔特征层次结构,就好像它是一个特征化的图像金字塔一样。输出多个尺度的预测。
(d) 特征金字塔网络 (FPN) 在速度上和b 和 c 的模型一样快速,但更准确。

FPN具体过程
下图说明FPN的具体过程:横向连接和自上而下路径的构建块,通过加法合并。
自上而下的特征图含有语义上更强的特征,但携带很少的定位信息。

论文研究了FeaturePyramidNetworks(FPN)在对象检测中的作用,该网络作为neck部分改进,用于融合多尺度特征。FPN通过重用ConvNet计算的金字塔特征层次结构提高效率和准确性。实验表明,尽管深度学习模型对尺度变化有内在的鲁棒性,但金字塔表示对于处理多尺度问题仍然至关重要。此外,还对比了FPN与仅使用单一尺度特征的方法。
最低0.47元/天 解锁文章
3991

被折叠的 条评论
为什么被折叠?



