红外街道图像的目标识别:多尺度+对象级数据增强
Multiscale Object Detection in Infrared Streetscape Images Based on Deep Learning and Instance Level Data Augmentation
文章目录
一、背景
1.红外目标检测与本文的目标
红外传感器技术一直在发展,基于红外图像的人脸识别和行人检测也在越来越引人注意。但是红外目标检测面临一些考验:目前对于红外图像的检测方法局限在单分类检测,对于包含许多类以及许多尺度的红外街道图像的研究很少;红外图像的分辨率和对比度很低,高质量红外图像数据的稀少也阻碍了对应目标检测的发展。
作者想要做到的是:
1)提高基于红外图像的神经网络对多尺度目标的检测能力
2)高质量图像少,存在类别不平衡问题,所以设计一种数据增强的方法,更好地利用数据
2.Faster R-CNN对多尺度不友好
Faster R-CNN的目标检测能力比较优秀,已经研究人员将Faster R-CNN应用到红外图像进行研究了,而且准确率要优于传统的方法。但是Faster R-CNN对多尺度检测的关注很少,它的一些设计是不利于多尺度检测的:
1)RPN只使用最后一层特征图提取区域建议ÿ