基于深度学习的全景交通标志实时检测与识别
摘要
- 随着无人驾驶的热度和交通安全的挑战,交通标志的检测和识别是无人驾驶的核心问题。研究它具有重要意义。目前,由于深度学习的应用,目标识别方法取得了良好的效果,但对实时全景高分辨率图像或视频中小目标的实时识别研究较少。本文提出了一种在高分辨率图像中进行小物体检测和识别的方法,并将其应用于全景图像中交通标志的检测和识别。首先,提出了训练数据集的数据预处理方法。然后设计了基于YOLOv3算法的交通标志网络(TSNet)。经过训练和微调,本文提出的新的滑动窗口算法处理了具有合理缩放的测试数据集。边界框的预测由删除子集 - 非最大抑制(DS-NMS)处理,以获得更高的准确度和实时检测效果。
关键词:交通标志识别;数据预处理; TSNet网络;滑动窗算法; DS-NMS算法。
引言
- 近年来,无人驾驶已成为全球关注的焦点,交通标志自动识别系统是完整无人系统的重要组成部分。同时,交通标志作为道路交通的重要组成部分,发挥着不可或缺的作用。可以看出,交通标志的实时检测和识别尤为重要。交通标志的识别属于物体检测领域。如今,在深度学习的指导下,物体检测的速度和准确性大大提高。然而,小物体的检测仍然是研究的热门话题,在实时全景图的高分辨率图像中检测小物体更加困难。在生活中,交通标志仅占视野的一小部分,占视野图像的约0.001%至5%,这对于实时交通标志的准确检测和识别是一个巨大的挑战。随着摄影器材硬件的改进,一些高清晰度图像很容易获得,每张图像的尺寸为3-lOM,具有高分辨率。对于M * JVI(M> 2000)图片的卷积神经网络输入,用于处理图片的计算机的GPU存储器难以满足要求。但在无人驾驶领域,交通标志检测和识别的实时要求非常高,难以在速度和准确度之间做出妥协。鉴于这两个问题,本文提出了一种方法。用于高分辨率图像中小物体的检测和识别,并应用于实时全景条件下交通标志的检测和识别,达到预期效果。我们做出以下贡献:
介绍了训练数据集中高分辨率的数据预处理方法。
- 提出了基于YOLOv3算法的交通标志网络(TSNet)的网络结构。
- 具有合理缩放的测试数据集由滑动窗口算法处理。
- 我们改进了非最大抑制算法,并提出了删除子集非最大抑制(DS -NMS)。
近来的工作
- 随着卷积神经网络(CNN)的出现,近年来物体检测的准确性和速度得到了极大的提高。基于卷积神经网络的目标检测方法可以分为两部分:基于候选区域的方法和基于回归的方法。例如,R-CNN [1],快速R-CNN [2],更快的R-CNN [3],FPN [4],掩码R-CNN [5]等等,是基于坦诚的候选检测算法基于回归方法的深度学习目标检测算法主要包括YOLO [6],SSD [7]和YOLOv2 [8],