1. 创新点
论文主要针对模型训练中出现的正负样本不均衡问题,根据困难样本挖掘原理,在原有的损失函数中引入调制因子,将背景部分视为简单样本,减小背景损失在置信损失中的占比,使得模型收敛更快速,模型训练更充分,从而提高了复杂背景下的目标检测精度。同时,通过构建特征金字塔和融合多层特征图的方式,实现对低层特征图的语义信息融合增强,以提高对小目标检测的精度,从而提高整体的检测精度。
2. 实现方法
本文检测模型以传统的基础网络VGG16 为基础,并添加深层卷积网络而构成。前部分浅层网络采用卷积神经网络提取图像特征,包括输入层、卷积层和下采样层。后部分深层网络用卷积层代替原始的全连接层。卷积层尺寸逐层递减,分类和定位回归在多尺度特征图上完成。
2.1 引入调制因子的损失函数
损失函数用来计算模型预测值与真实值的不一致程度。对样本集合(x,y),本文采用了多任务损失函数(Multi-Task Loss Function),可以在损失函数中完成置信度判别和位置回归,两者加权求和,得到最终的损失函数。

为解决正负样本不平衡问题,本文首先将所有的待训练先验框进行排序,按照置信度得分情况从大到小排列,取前四分之一为正样本,其余为负样本,以减少负样本比重。同时,在原损失函数中引入调制因子,增加困难样本对参数的贡献值。
2.2 多层特征融合结构
SSD 网络分别在conv4_3 至conv11 的6 层特征图上进行分类

最低0.47元/天 解锁文章
1417





