【学习-目标检测】目标检测之—FPN+Cascade+Libra

FPN通过多尺度特征融合提升目标检测性能,RoIAlign确保精确区域采样。CascadeRCNN引入级联结构优化阈值,提升训练效果。Libra则关注采样平衡和损失函数优化,解决特征利用和训练不平滑问题。

FPN-多尺度

在这里插入图片描述
FPN相比faster RCNN,在特征提取和训练的过程中考虑到多尺度的问题,使用不同尺度上的特征并进行充分融合,得到最终多个层级的预测结果
从上图中可以看到,在图像进入backbone进行特征提取后,分别在C2\C3\C4\C5四个尺度上继续1x1特征提取和组合,最终进行四个尺度的预测输出。其中在每一个环节中的输出有1*1conv进行通道调整和上采样进行特征融合。

FPN整体结构

在这里插入图片描述
从上图的结果可以看到:

  1. backbone提取特征通过FPN得到四个维度的输出(特征图)
  2. RPN在FPN输出特征基础上生成anchor并进行采样
  3. ROI Align将ROI 生成区域分配到对应特征层并进行降维和训练,得到最终预测结果。

FPN的RoI Align

在这里插入图片描述
分配方法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值