基于改进特征词汇表的图像分类方法
1. 引言
随着数字图像数量的急剧增长,图像分类技术受到了广泛关注。图像分类旨在将图像标记或归类到预定义的类别中,其相似度属性因系统而异,主要基于颜色、纹理和形状特征。
图像分类具有广泛的应用,包括图像搜索、事件检测(监控)、过程控制(通过机器人或自动驾驶车辆)以及人机交互等。这些应用的发展主要得益于消费设备中数字图像传感器的普及,如手机,以及计算机处理能力的不断提升,使得图像处理算法能够更快地执行。
在深入探讨图像分类之前,有必要区分对象分类与其他类似但不同的任务,如对象识别、基于内容的图像检索和对象检测。对象分类是将图像中的对象与正确的标签关联起来;对象识别是识别特定的对象实例;基于内容的图像检索主要处理低级图像特征,可能不够精确;对象检测通常专注于单个视觉类别。
2. 特征提取与描述
特征提取是在图像中定位感兴趣点的方法,这些点可添加到数据库中以便后续识别对象。特征描述则是描述数据库中定位点邻域的方法。在比较各种特征提取和描述方法时,有两种方法在实时处理方面表现出色:一种是 Mikolajczyk 和 Schmid 提出的仿射不变兴趣点检测器,另一种是 Lowe 提出的尺度不变特征变换(SIFT)。
2.1 仿射不变兴趣点检测器
该检测器基于 Harris - Laplace 检测器,它仅对尺度变化具有不变性。其工作流程如下:
1. 找到点 x(k) 上 LoG(Laplacian - of - Gaussian)滤波器在尺度上的局部极值 σ,否则拒绝该点。研究的尺度范围限制为 σ(k + 1) = tσ(k),其中 t ∈ [0.7, 1.4