目标检测算法之HOG特征

      HOG特征,即方向梯度直方图(Histogram of Oriented Gradient, HOG),是计算机视觉领域中用于目标检测的一种特征描述子。其通过计算图像部分区域的梯度信息,并进行统计梯度信息的直方图来构成特征向量。通常地,将HOG所提取到的特征向量喂入预训练好的SVM分类器,可实现图像识别的功能。HOG+SVM的思路在2005年CVPR上提出,在行人识别检测上表现出了很好的效果。

HOG特征核心思想
  1. 基于梯度:HOG特征用于目标检测,为了找到局部目标,寻找其轮廓是可行且必要的方法。一般来说,在物体的边缘部分才有比较明显的梯度(背景或物体内部色彩变化不明显,因此梯度也不明显),所以物体的表象与形状可以较好的被梯度描述。

  2. 特征描述子:特征描述子是一种图像特征的表示。在HOG里面,它可以将原来尺寸大小为w∗hw*hwh的图像转化成为一个长度为n的向量,以此来保留原始图像中重要的信息(梯度),并且过滤掉一些不相关的信息(如背景)。例如在OpenCV的API中,一副64*128大小的图像,经过转化后变成一个长度为3780的向量(下文会有详细分析)

  3. 划分区域cell:将一副图像划分成若干个连通的小区域(一般为正方形),这些小区域成为细胞单元(cell)。一个cell中包含若干个像素点,如8*8。计算这个cell中每个像素点所对应的梯度,并构成方向梯度直方图,将每一个cell得到的直方图结合起来,即可得到特征描述器。

  4. 更大的区域block:为了消除光照和阴影对于图像的影响,需要在更大的区域内,对这些cell对应的直方图进行对比度归一化。

实现步骤
  1. 图像灰度化:若输入的图像是RGB三通道的图像,则首先需要将其转化为灰度图。

  2. Gamma矫正法:利用Gamma变换对 1 中得到的灰度图像进行标准化,以减少光照因素的影响。Gamma变换的公式如下:

    f(I)=Iγf(I) = I^{\gamma}f(I)=Iγ

    γ\gammaγ 此处可以取0.5等数值

  3. 计算每一个像素的梯度(梯度大小及方向):通常利用[-1,0,1]算子与原图像进行卷积,得到每个像素在水平方向的梯度;同时利用[−1,0,1]T[-1,0,1]^T[101]T算子与原图像卷积,得到每个像素在竖直方向的梯度。利用两个方向的梯度的合成,得到总的梯度大小与方向,其计算公式如下:

    Gx(x,y)=I(x+1,y)−I(x−1,y)G_{x}(x,y) = I(x+1,y) - I(x-1,y)Gx(x,y)=I(x+1,y)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值