文章目录
FPN-多尺度

FPN相比faster RCNN,在特征提取和训练的过程中考虑到多尺度的问题,使用不同尺度上的特征并进行充分融合,得到最终多个层级的预测结果。
从上图中可以看到,在图像进入backbone进行特征提取后,分别在C2\C3\C4\C5四个尺度上继续1x1特征提取和组合,最终进行四个尺度的预测输出。其中在每一个环节中的输出有1*1conv进行通道调整和上采样进行特征融合。
FPN整体结构

从上图的结果可以看到:
- backbone提取特征通过FPN得到四个维度的输出(特征图)
- RPN在FPN输出特征基础上生成anchor并进行采样
- ROI Align将ROI 生成区域分配到对应特征层并进行降维和训练,得到最终预测结果。
FPN的RoI Align

分配方法

FPN通过多尺度特征融合提升目标检测性能,RoIAlign确保精确区域采样。CascadeRCNN引入级联结构优化阈值,提升训练效果。Libra则关注采样平衡和损失函数优化,解决特征利用和训练不平滑问题。
最低0.47元/天 解锁文章
1364

被折叠的 条评论
为什么被折叠?



