FPN结构详解

部署运行你感兴趣的模型镜像

Feature Pyramid Networks

FPN主要解决的是物体检测中的多尺度问题,通过简单的网络连接改变,在基本不增加原有模型计算量的情况下,大幅度提升了小物体检测的性能。
在这里插入图片描述
(a)为特征图像金字塔结构,要检测不同尺度目标时会将图片进行缩放,针对每个尺度的图片都依次通过进行预测。(速度慢)

(b)为单一特征图结构,将图片通过backbone得到最终特征图,在最终特征图上进行预测。(对小目标不友好)

©为金字塔特征层次结构,将图片输入backbone,在backbone正向传播过程中得到的不同的特征图上分别进行预测。(小目标容易被错分)

(d)为特征图金字塔网络,将不同特征图上的特征进行融合,在融合之后的特征图上再进行预测。FPN是一个利用深度卷积神经网络中固有的多尺度特征图,通过加入侧向连接和上采样,来以极小的附加计算量构建不同尺度的具有高级语义信息的特征金字塔的网络结构。

对于目标检测模型而言,FPN结构并不是模型中独立的一个模块,而是作为原始Backbone的附加项,融合在卷积神经网络之中。

特征图融合

在FPN中采用的不同的特征图需要选取都是2倍关系,例如最底层的特征图大小为28x28,则其上一层的特征图大小为14x14,最上层的为7x7。
在这里插入图片描述
每一个特征图都会对其采用1x1的卷积层进行处理,调整backbone上不同特征图的channel,为了融合保证channel相同。

对高层次的特征图进行2倍上采样,如对最上层7x7大小的特征图进行2倍上采样,得到14x14的特征图,从而保证与中间层特征图的尺寸大小相同

上两步处理后,最高层与中间层的特征图的shape完全相同,就可以进行add操作。

然后将融合得到的特征图再进行2倍上采样,与经过1x1卷积后的最底层特征图进行add操作。

FPN结构

以ResNet50为backbone,输入为640x640x3的图像。
ResNet网络:ResNet网络详解并使用pytorch搭建模型
在这里插入图片描述
在图中右半部分,融合得到新的特征图之后又进行了3x3卷积,这里是为了对融合之后的特征图进行进一步的融合

参考:FPN结构详解

您可能感兴趣的与本文相关的镜像

Yolo-v8.3

Yolo-v8.3

Yolo

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎

### PAN 和 FPN 结构概述 在深度学习领域,特别是目标检测任务中,特征金字塔网络(Feature Pyramid Network, FPN)和路径聚合网络(Path Aggregation Network, PAN)是非常重要的两种架构设计。这些结构旨在改进多尺度目标检测的效果。 #### 特征金字塔网络 (FPN) FPN 是一种经典的自上而下的架构,它通过融合不同层次的特征图来增强模型对多尺度目标的感知能力[^1]。具体来说,FPN 使用顶层特征图逐步生成低分辨率到高分辨率的特征表示,并将其与底层特征图进行逐元素相加或连接操作。这种机制能够有效缓解因下采样而导致的小物体丢失问题,从而提升小目标检测精度。 以下是实现 FPN 的核心步骤之一: ```python def upsample_add(x_high_res, x_low_res): """ 上采样并叠加高低层特征图。 参数: x_high_res: 高分辨率特征图 x_low_res: 低分辨率特征图 返回: 融合后的特征图 """ import torch.nn.functional as F x_upsampled = F.interpolate(x_low_res, size=x_high_res.shape[-2:], mode='nearest') return x_high_res + x_upsampled ``` #### 路径聚合网络 (PAN) 相较于 FPN 只有单一方向的信息流,PAN 提出了更复杂的双向信息传递方式——既包含自上而下的增强路径也引入了自底向上的补充路径[^3]。这样不仅可以继承来自高层语义丰富的全局上下文信息,还能充分利用浅层局部细节特征,进一步优化整体表现尤其是针对密集型场景的目标定位准确性方面具有显著优势。 值得注意的是,在某些特定应用场景比如人体姿态估计里提到过类似思路的应用实例:即结合现有检测框架同单独设立用于捕捉个体肢体关键点分布规律部分共同作用完成整个流程;不过这种方式存在局限性在于其最终效果很大程度取决于前者所提供候选框质量以及计算效率难以达到实时处理标准等问题尚未完全解决好之前版本当中可能遇到挑战情况较多一些。 综上所述,无论是作为独立组件还是嵌入更大规模系统内部组成部分来看待时都可以发现它们各自独特之处所在同时也面临着相应技术难点等待突破进展之中不断演进完善自我功能特性满足日益增长复杂需求环境变化趋势之下持续探索前行之路从未停歇脚步!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值