fhog特征

本文详细介绍了HOG特征提取过程,包括灰度化、gamma校正、梯度计算、构建9维特征向量、归一化截断、PCA降维等步骤,并探讨了有方向梯度的处理方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.hog特征提取—9维特征向量

步骤1:灰度化(将输入的RGB三通道图像转化为单通道图像);

步骤2:采用gamma校正法对输入图像进行颜色空间的标准化,校正公式为: I ( x , y ) = I ( x , y ) g a m m a I(x,y)=I(x,y)^{gamma} I(x,y)=I(x,y)gamma
其中gamma=1/2, 通过Gamma压缩处理,可以降低光照变化以及局部图像阴影的影响;
步骤3:计算图像梯度,包括每个像素点的梯度值和梯度方向。x方向和y方向的卷积核分别为: G x = [ − 1 , 0 , 1 ] , G y = [ 1 , 0 , − 1 ] T G_{x}=[-1,0,1],G_{y}=[1,0,-1]^{T} Gx=[1,0,1],Gy=[1,0,1]T
得到 I ( x , y ) I(x,y) I(x,y)水平方向梯度 G x ( x , y ) G_{x}(x,y) Gx(x,y)(水平向右为正方向),垂直方向梯度 G y ( x , y ) G_{y}(x,y) Gy(x,y)(垂直向上为正方向),每个像素点的梯度 G ( x , y ) G(x,y) G(x,y)和梯度方向 α ( x , y ) α(x,y) α(x,y)分别为: G ( x , y ) = G x 2 + G y 2 G(x,y)=\sqrt{G_{x}^{2}+G_{y}^{2}} G(x,y)=Gx2+Gy2 α ( x , y ) = a r c t a n ( G x ( x , y ) G y ( x , y ) ) \alpha (x,y)=arctan(\frac{G_{x}(x,y)}{G_{y}(x,y)}) α(x,y)=arctan(Gy(x,y)Gx(x,y))

步骤4:构建9维hog特征向量:

将图像分成若干个“cell”,例如每个cell为66个像素。采用9个bin的直方图来统计这66个像素的梯度信息。也就是将cell的梯度方向360度分成9个方向块,如下图所示:若某个像素的梯度方向是0-20度或180-200度,直方图第1个bin的计数就加一,这样,对cell内每个像素用梯度方向在直方图中进行加权投影(权值与梯度值相关,如该像素点梯度值为3,权值即为3),就可以得到这个cell的梯度方向直方图了,就是该cell对应的9维特征向量(即9个bin直方图)。
在这里插入图片描述

2.归一化截断
通过归一化截断得到每个cell对应的36为特征向量。已知 C ( i , j ) C(i,j) C(i,j)为第 ( i , j ) (i,j) (i,j)个cell的9维特征向量,与其相邻的特征向量为: [ C ( i − 1 , j − 1 ) C ( i − 1 , j ) C ( i − 1 , j + 1 ) C ( i , j − 1 ) C ( i , j ) C ( i , j + 1 ) C ( i + 1 , j − 1 ) C ( i + 1 , j ) C ( i + 1 , j + 1 ) ] \begin{bmatrix} C(i-1,j-1) &C(i-1,j) &C(i-1,j+1) \\ C(i,j-1) &C(i,j) &C(i,j+1) \\ C(i+1,j-1) &C(i+1,j) &C(i+1,j+1) \end{bmatrix} C(i1,j1)C(i,j1)C(i+1,j1)C(i1,j)C(i,j)C(i+1,j)C(i1,j+1)C(i,j+1)C(i+1,j+1)
定义 N β , γ N_{\beta,\gamma} Nβ,γ为: N β , γ = ( ∣ ∣ C ( i , j ) ∣ ∣ 2 + ∣ ∣ C ( i + β , j ) ∣ ∣ 2 + ∣ ∣ C ( i + β , j + γ ) ∣ ∣ 2 + ∣ ∣ C ( i , j + γ ) ∣ ∣ 2 ) 1 / 2 N_{\beta,\gamma }=(||C(i,j)||^{2}+||C(i+\beta,j)||^{2}+||C(i+\beta,j+\gamma)||^{2}+||C(i,j+\gamma)||^{2})^{1/2} Nβ,γ=(C(i,j)2+C(i+β,j)2+C(i+β,j+γ)2+C(i,j+γ)2)1/2

则36维特征向量 H ( i , j ) H(i,j) H(i,j)即为: H ( i , j ) = ( M i n ( N − 1 , − 1 ( i , j ) , C ( i , j ) ) M i n ( N 1 , − 1 ( i , j ) , C ( i , j ) ) M i n ( N 1 , 1 ( i , j ) , C ( i , j ) ) M i n ( N 1 , 1 ( i , j ) , C ( i , j ) ) ) H(i,j)=\begin{pmatrix} Min(N_{-1,-1}(i,j),C(i,j))\\ Min(N_{1,-1}(i,j),C(i,j))\\ Min(N_{1,1}(i,j),C(i,j))\\ Min(N_{1,1}(i,j),C(i,j)) \end{pmatrix} H(i,j)=Min(N1,1(i,j),C(i,j))Min(N1,1(i,j),C(i,j))Min(N1,1(i,j),C(i,j))Min(N1,1(i,j),C(i,j))
3.PCA降维
下图是36个主成分,前12个横条和竖条状的特征向量占据大部分,分别按行和按列求和,一共得到4+9=13维特征向量。
在这里插入图片描述
图片来源于论文《Object Detection with Discriminatively Trained Part Based Models》
4.计算有方向梯度,得到18维特征向量
上述1、2、3是假设梯度无方向,考虑有方向的梯度,那每个Cell就有360/20=18维hog特征,再由第2步得到4*18维特征,然后按行求和得到18维特征向量,此时不再进行列求和。故无向和有向一共31维向量。

5.fhog特征提取示意图
在这里插入图片描述
整幅图像划分为若干个Cell,得到特征图。

C++(OpenCV版)fhog特征提取代码:https://github.com/ll1041327742/fhog

参考链接
【1】https://blog.youkuaiyun.com/zouxy09/article/details/7929348
【2】https://blog.youkuaiyun.com/sysu_yuhaibao/article/details/76599926
【3】原DPM论文《Object Detection with Discriminatively Trained Part Based Models》

### FHOG 特征在 Verilog 中的实现 目前,在公开资源中较少见到直接针对 FHOG (Fused Histogram of Oriented Gradients) 特征提取算法的 Verilog 实现案例。FHOG 是一种基于 HOG 的改进版本,主要用于描述图像局部形状特性并广泛应用于目标检测领域[^1]。 对于硬件加速的需求而言,将此类复杂的计算机视觉算法转换成适合 FPGA 或 ASIC 设计的语言如 Verilog 需要特别考虑计算效率与资源消耗之间的平衡。通常情况下,这类任务会涉及到以下几个方面: #### 数据预处理模块 由于原始图片数据通常是二维数组形式存储,而硬件设计更倾向于流水线操作和平行化处理方式,因此需要先对输入图像进行必要的变换以便后续阶段能够高效执行。这部分可能包括但不限于灰度化、降采样等基本操作。 #### 梯度计算单元 根据定义,FHOG 要求计算每个像素点处沿不同方向上的梯度强度以及角度信息。这一过程可以通过卷积运算完成,具体来说就是应用 Sobel 算子或其他类似的微分滤波器来近似估计水平和垂直方向的一阶导数值\[Sobel\]。之后再利用反正切函数获得最终的方向角,并据此分配到相应的 bin 当中去形成直方图结构[^5]。 ```verilog module gradient_calculator ( input wire clk, input wire rst_n, input wire signed [7:0] img_data, // 假设8位灰度值作为输入 output reg signed [7:0] grad_x, output reg signed [7:0] grad_y ); // ...省略内部逻辑... endmodule ``` #### 细胞区域划分与直方图构建电路 按照指定大小切割整个待测对象窗口内的各个小区(cell),并对每一个 cell 内部所有位置重复上述步骤以累积其贡献至对应区间(bin)之中;此环节往往伴随着归一化措施防止过拟合现象发生同时也利于提高分类性能表现。 然而值得注意的是,尽管存在一些开源项目提供了 C/C++ 或 Python 编写的软件级解决方案用于理解原理[^2],但在实际着手编写 Verilog 描述之前还需要深入研究具体的数学模型细节及其背后的物理意义——特别是当面对特定应用场景下的优化需求时更是如此。此外,考虑到实时性和功耗等因素的影响,建议参考已有的类似工作成果比如 Dlib 库里的人脸识别流程来进行针对性的设计调整[^3]。 综上所述,虽然现阶段缺乏完整的 FHOG 特征 Verilog 实现指南,但从零开始搭建这样一个系统并非不可能的任务。有兴趣的研究者可以从最基础的功能块做起逐步完善直至满足预期功能为止。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值