基于边界框回归损失的目标检测器以其简单、高效的特点被广泛应用于计算机视觉领域。损失函数中定位算法的精度会影响网络模型检测结果的平均精度。我们在Complete Intersection over Union(CIoU)损失函数的基础上提出了一种改进的提高定位精度的算法。具体来说,该算法在于更全面的考虑预测框和真值框的匹配,利用预测框与真值框高宽比尺寸的比例关系,在真值框和预测框对应的宽高比值相同条件下,考虑预测框对定位精度的影响因素,这样强化了惩罚函数的作用,提高了网络模型的定位精度。我们称这个损失函数是Improved CIoU (ICIoU)。在Udacity, PASCOL VOC(Pascal Visual Object Classes)和MS COCO(Microsoft Common Objects in Context)数据集上的实验,证明了ICIoU用于单级目标检测器YOLOv4在提高模型定位精度方面的有效性。所提出的ICIoU算法相比IoU可以在Udacity测试开发上显著提高AP 1.92%和AP75 3.25%。它还可以在PASCAL VOC上显著提高AP 1.72%和AP75 3.44%, 在COCO测试开发上显著提高AP 1.26%和AP75 3.47%。我们的算法相比CIoU在Udacity测试开发上显著提高AP 0.57%和AP75 0.12%。它还可以在PASCAL VOC上显著提高AP 0.26%和AP75 1.28%, 在COCO测试开发上显著提高AP 0.06%和AP75 0.65%
一、 Introduction
目标检测是计算机视觉任务中的关键问题之一,近年来,卷积神经网络越来越多的应用于计算机视觉领域[1-11]。用卷积神经网络解决目标检测问题时,无论是回归问题还是分类问题,都少不了使用损失函数(Loss Function)。损失函数(Loss Function)是用来估量模型的预测值 f(x) 与真实值 y 的不一致程度。我们训练模型的主要任务就是使用优化方法来寻找损失函数最小化对应的模型参数,损失函数决定了模型的最优值是什么,所以不同目标检测器的性能受到损失