概述
HOG(Histogram of Oriented Gradients)方向梯度直方图是图像识别的一个常用特征。其基本思路是计算图片的图像梯度,从而检测出边缘,再将图像梯度进行归纳和缩减,减少特征向量的维度。有了这个特征向量,后面就可以用学习算法进行训练和识别。
1.划分8*8小块并计算图像梯度
HOG的计算过程第一步,先将图像划分为8*8的小块,针对每个小块的每一个像素,都可以计算得到一个图像梯度,这个图像梯度有一个角度angle(0-180度)(方向)和一个大小magnitude(绝对值)。角度表示颜色变化的方向,而大小表示颜色变化的剧烈程度。
如何计算图像梯度可以看我的上一篇博客
下图是一个图像梯度计算示例。

上图中共有左中右三部分,分别有不同的含义,下面分别加以说明。
最左面是原始图片,被分成8 * 8的小方块。注意红色框出的是后面要进行示例计算的一个小块。
中间的图是红色框出来的小方块的放大图,共 8 * 8 =64个像素,每一个小格是一个像素。每个像素上用箭头标出和图像梯度,箭头方向表示梯度角度,箭头长度表示梯度大小。
最右面的图是这个8 * 8小方块计算得到的图像梯度的大小(上面表格)和角度(下面表格)。
有了这个8 * 8小块的图像梯度以后,下面就可以计算HOG了。
2.根据图像梯度计算HOG
目前为止得到了图像梯度,一个8 * 8的小方块需要8 * 8 * 2=128个数值来描述它。这个数量太大,计算耗时太久。HOG可以将这128个数值缩小到9个数值,同时还保留了主要特征,去除了干扰噪声。下面来说

HOG(方向梯度直方图)是一种广泛应用于图像识别的特征提取方法。通过计算图像的梯度并归纳为直方图,减少特征向量维度,保留关键信息。本文详细介绍了HOG的计算过程,包括图像梯度计算、方向梯度直方图生成及正则化处理。
最低0.47元/天 解锁文章
2404

被折叠的 条评论
为什么被折叠?



