目标检测技术:原理、模型与实验实现
1. 重组织层与多尺度训练
重组织层与最大池化层不同,最大池化层会减少输入信息,而重组织层在操作后能保留输入的原始信息。
在YOLO - v2模型训练时,采用了多尺度训练策略。每10个批次就会改变输入图像的大小,输入图像大小取32的倍数,如320、352、384、416、448、480、512、544、576和608,最小输入图像尺寸为320 x 320,最大为608 x 608。这种训练策略有助于YOLO - v2克服多尺度目标检测的问题,同时保持实时速度。
2. 特征金字塔网络(FPN)
2017年,Lin等人提出了特征金字塔网络(FPN)。FPN采用带有横向连接的特征金字塔架构,用于不同尺度的目标检测,尤其适用于小目标检测。
CNN用于特征提取时,深层具有低分辨率和丰富语义特征的特点,而浅层则包含高分辨率和弱语义信息的特征。这导致使用CNN金字塔特征层次结构进行多尺度目标检测的检测器性能不佳。为了构建一个各层都包含丰富语义的特征金字塔,FPN通过自上而下的路径从语义丰富的层构建高分辨率层。由于重建层具有强大的语义特征,但缺乏目标的位置信息,因此在这些层和相应的特征图之间添加横向连接,以更好地预测目标位置。
有四种主要的网络架构可提高目标检测性能:
| 架构名称 | 特点 | 代表模型 | 优点 | 缺点 |
| ---- | ---- | ---- | ---- | ---- |
| 图像金字塔网络 | 对每个图像尺度独立计算预测特征 | 无 | 有效 | 运行时间非常慢 |
| 单特征图网络 | 使用单尺度特征进行预测 | YOLO
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



