计算机视觉中的交通标志检测与识别:从传统方法到卷积神经网络
1. 计算机视觉问题解决范式
在解决计算机视觉问题时,通常的范式是使用更具信息性的向量(特征向量)来表示原始图像,然后基于从训练集中收集的特征向量训练分类器。从分类的角度来看,有一些现成的方法,如梯度提升、随机森林和支持向量机,它们能够准确地对非线性决策边界进行建模。因此,解决计算机视觉问题主要依赖于特征提取算法。
一些特征提取方法,如尺度不变特征变换(SIFT)、方向梯度直方图(HOG)、Gabor滤波器组、局部二值模式(LBP)、特征袋和Fisher向量等,与它们的前身相比表现出色。这些方法主要通过几个步骤创建特征向量。例如,SIFT和HOG首先计算图像的梯度,然后在不同区域上对梯度幅值进行池化并连接起来,以创建最终的特征向量。类似地,特征袋和Fisher向量从在图像上的一组显著点周围的区域提取特征向量(如HOG)开始,然后再次对这些特征进行池化,以创建更高级别的特征向量。
然而,尽管计算机视觉界付出了巨大努力,但上述手工设计的特征无法很好地对大量自然物体类别进行建模。卷积神经网络(ConvNets)、大型数据集和并行计算硬件的出现改变了计算机视觉的发展方向。卷积神经网络无需手动设计特征向量,而是学习一个复合特征变换函数,使物体类别在特征空间中线性可分。
近年来,卷积神经网络在自然物体分类和交通标志分类等不同任务中已经超越了人类。取得巨大成功后,卷积神经网络成为从训练数据中学习特征的首选方法。汽车行业是受卷积神经网络影响较大的领域之一,行人检测、汽车检测、交通标志识别、交通灯识别和道路场景理解等任务现在很少再使用手工制作的特征。
超级会员免费看
订阅专栏 解锁全文
11万+

被折叠的 条评论
为什么被折叠?



