作者 张旭 编辑 徐松
1. HOG简介
2. 数字图像梯度定义
3. HOG基本步骤
4. OpenCV实现HOG
5. 用KNN与HOG实现一个手写数字输入识别
1. HOG简介
方向梯度直方图(Histogram of Oriented Gradient, HOG)于2005年提出,是一种常用的特征提取方法,且HOG+SVM的方式在行人检测中有着优异的效果。经典的论文为《Histograms of oriented gradients for human detection》,这篇文章中,HOG就是用来做行人检测的。作者研究了行人检测的特征集问题,局部归一化的HOG描述子相比于现存的特征集有着更好的表现。HOG是大小统一的cell上进行梯度方向投影计算得到的,而且为了提高性能,还采用了重叠的局部对比度归一化。HOG描述子针对一个检测窗口,根据窗口中块的个数,块内cell的个数,以及cell内bins的个数串接得到最后的HOG描述子。
2. 数字图像梯度定义
在具体说明HOG算法之前,需要解释一下图像梯度的概念,在数字图像中,图像梯度信息包含梯度幅值(梯度大小)和梯度相位(梯度方向)大小,梯度幅值G(x,y)计算如公式(1)、(2)、(3)所示,其中Gx(x,y),Gy(x,y)分别为x,y方向上的分量。梯度相位θ(x,y)计算如公式(4)所示: