目标检测与图像增强分割技术解析
1. Faster R - CNN训练详解
1.1 Faster R - CNN架构与训练挑战
Faster R - CNN具有独特架构,无法像常规CNN那样训练。若网络两部分分开训练,特征提取器的权重将无法共享。其完整架构能处理任意输入大小的图像。
1.2 区域提议网络(RPN)训练
- 输入与输出 :RPN输入为图像,输出是感兴趣区域(RoIs)列表。每张图像有H × W × k个提议(H和W是特征图大小,k是锚框数量),此时不考虑物体类别。
- 采样技术 :直接训练所有提议较困难,因图像多为背景,网络易学会总预测背景。故采用采样技术,构建256个真实锚框的小批量,其中128个为正样本(包含物体),128个为负样本(仅含背景)。若正样本少于128个,则使用所有正样本,其余用负样本填充。
1.3 RPN损失函数
RPN损失函数比YOLO简单,由两部分组成:
[L_{rpn}(p_i,p_i^ ,t_i,t_i^ )=\frac{1}{N_{cls}}\sum_{i}L_{cls}(p_i,p_i^ )+\lambda\frac{1}{N_{reg}}\sum_{i}p_i^ L_{reg}(t_i,t_i^ )]
各参数含义如下:
|参数|含义|
| ---- | ---- |
| (i) | 训练批次中锚框的索引 |
| (p_i) | 锚框为
超级会员免费看
订阅专栏 解锁全文
927

被折叠的 条评论
为什么被折叠?



