RCNN, Fast RCNN, Faster RCNN,针对每一分类做proposal regression,都是与类别相关的。
Faster RCNN的bbox,第一次粗回归,只有前景、背景2类,第二次位置精修就有n类(n可以是20,80等)类别更多、回归也更精细。
RCNN
算法步骤
- 一张图像生成1K~2K个候选区域
- 对每个候选区域,使用深度网络提取特征
- 特征送入每一类的SVM 分类器,判别是否属于该类
- 使用回归器精细修正候选框位置
位置精修
回归器
针对每一类目标,使用一个线性脊回归器进行精修。正则项λ=10000λ=10000。
输入为深度网络pool5层的4096维特征,输出为xy方向的缩放和平移。
训练样本
判定为本类的候选框中,和真值重叠面积大于0.6的候选框。
Fast RCNN
算法步骤
- 图像归一化为224×224直接送入网络。使用SS生成候选区域
- 一张图像进入深度网络提取特征
-

本文详细介绍了RCNN、Fast RCNN和Faster RCNN的算法步骤与位置精修,包括Box Regression在不同阶段的应用。Fast RCNN采用ROI Pooling层和多任务损失函数实现端到端训练,而Faster RCNN引入RPN网络进一步提高速度和精度。损失函数方面,RCNN和Fast RCNN使用交叉熵与Smooth L1损失,Faster RCNN采用multi-task loss。

最低0.47元/天 解锁文章
1371

被折叠的 条评论
为什么被折叠?



