前言
由于近期接触到HOG+SVM行人识别检测这一方面,因此总结了一下关于HOG特征的一些基础知识。所引用的视频为sundog-education-hog,在此感谢投稿者。
更新!!! 运用代码更加深刻认识HOG!!在此感谢大奥特曼打小怪兽。
一、梯度基础知识
- 对于函数 f ( x , y ) f(x,y) f(x,y),梯度是一个向量 ( f x , f y ) (f_x,f_y) (fx,fy)
- 一张照片可看作是关于 ( x , y ) (x,y) (x,y)的离散型函数,所以一张图片的梯度可以被计算出来。
- 对于每一个像素,图像的水平梯度和纵向梯度可以被计算出
- 这些向量有方向 a t a n ( f y f x ) atan(\frac{f_y}{f_x}) atan(fxfy)和大小 ( f x 2 + f y 2 ) \sqrt{(f_{x}^{2}+f_{y}^{2})} (fx2+fy2)
- 梯度值的范围为0-225,黑色为0,白色为225。像素从黑色急剧转为白色称为大的负向变化,颜色会变白色,像素如果