FPN论文笔记

本文基于《Feature Pyramid Networks for Object Detection》论文,详细介绍了FPN如何在微小的计算成本下,利用深度卷积网络的multi-scale特性,实现高效特征提取。文章对比了图像金字塔和金字塔特征层,阐述了FPN的bottom-up、top-down通路及横向连接的设计理念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.介绍

1.1.介绍

本文基于《Feature Pyramid Networks for Object Detection》翻译总结。FPN即特征金字塔网络,在微不足道的代价(计算、存储)下,利用了深度卷积网络中内在的multi-scale 金字塔特征层,在特征提取方面取得了良好的效果。

2.相关知识介绍

2.1.Featurized image pyramid图像金字塔

在这里插入图片描述
在人工特征领域大量使用。如上图所示,是对不同大小的图片提取特征进行预测。推理时间会相应的的增加,4层就增加4倍,所以此方法在实际应用中有点不太现实。像SIFT特征提取是基于这种图像金字塔的。

2.2.Pyramidal feature hierarchy金字塔特征层

在这里插入图片描述
深度卷积网络也会计算不同的特征层,存在内在的multi-scale,金字塔形状。上图是single shot detector(SSD)的模型图。
不过faster-R-CNN一般建议使用单尺度的特征,主要是为了在准确率和速度间权衡。

3.FPN

在这里插入图片描述

如上图所示,FPN包括三部分,分别是bottom-up 通路,top-down 通路,一个横向连接(包含上采样、1*1卷积减少channel维度)。这样就既有低分辨率语义强的特征,又有高分辨率语义弱的特征。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI强仔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值