上一章:深度篇——图像处理的一些方法(二) 细说 性能评估 IOU 和 GIOU
下一章:深度篇——图像处理的一些方法(四) 细说 图像金字塔
本小节,细说 HOG 特征 与 bag-of-word,下一小节细说 图像金字塔
五. HOG (Histogram of Oriented Gradient, HOG) 方向梯度直方图特征
HOG 特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算饿统计图像局部区域的梯度方向直方图来构成特征。HOG 特征结合 SVM 分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是:HOG + SVM 进行行人检测的方法是法国研究人员 Dalal 在 2005 年的 CVPR 上提出的,而如今虽然有很多检测算法不断提出,但基本都是以 HOG + SVM 的思路为主。
1. 主要思想
在一幅图像中,局部目标的表象和形状(appearance and shape) 能够被梯度或边缘的方向密切分布很好地描述。(本质:梯度的统计信息,而梯度主要存在于边缘的地方)。
2. 具体的实现方法
首先将图像分成小的连通区域,把它称为细胞单元,然后采集细胞单元中各像素点的梯度或边缘的方向直方图。最后把这些直方图组合起来构成特征描述器。
3. HOG 特征提取算法的实现过程
HOG 特征提取方法就是将 一张 image (要检测的目标或扫描窗口)
(1). 灰度化 (将图像看作一张 x、y、z (灰度) 的三维图像)
(2). 采用 Gamma 矫正法对输入图像进行颜色空间的标准化(归一化)。目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪声的干扰。首先需要将整张图像进行归一化,在图像的纹理强度中,局部的表层曝光贡献较大,所以,这种压缩处理能够有效地降低图像局部的阴影和光照变化。因为颜色信息作用不大,通常先转化为灰度图。Gamma 压缩公式:比如可以取
(3). 计算图像每个像素的梯度(包括大小与方向),