OpenCV中 关于hog特征向量的个数的计算

本文详细解析了HOG特征的基本原理,包括构造函数参数的含义、特征向量的生成方式以及如何计算一张图像的特征向量总数。通过实例演示了如何使用OpenCV库中的HOGDescriptor类来实现HOG特征的提取,并解释了padding参数的作用以及其对特征数量的影响。

转自:http://gz-ricky.blogbus.com/logs/85326280.html



今天脑袋终于开窍了,把hog的特征个数弄懂了一点

  •  
    其实原理是很简单的,在OpenCV实现的是R-HOG,即对图像img->窗口window->块block->细胞单元cell进行向量统计
    首先看描述器的构造函数,我用
    HOGDescriptor *desc=new HOGDescriptor(cvSize(40,80),cvSize(10,20),cvSize(5,10),cvSize(5,5),9);
    进行测试。
     
    这里的window为(40, 80), block为(10, 20),block的步进stride是(5, 10), 细胞单元cell是5 * 5像素,每个cell的直方图bin是9。
    于是, 对每一个cell, 有9个向量
  •  
    对每一个block,有2*4个cell,所以有72个向量
  •  
    对于window而言,计算block个数的方法是,对两个方向计算 (window_size - block_size)/block_stride + 1,算得共有7*7 个block,共有72*49=3528个向量
     
     
  •  
  • 在搜索img,计算图片特征的时候, 调用desc->compute(img,w,cvSize(10,20),cvSize(0,0));
    其中img是输入图像, w是保存向量的vector,第三个是window的步进,第四个是padding, 用于填充图片以适应大小的。  
  •  
    当设置padding为默认(0,0)时, 计算(img_size - window_size) / window_stride +1 不一定为整数
  •  
    在compute函数中可以看到:
        padding.width = (int)alignSize(std::max(padding.width, 0), cacheStride.width);
        padding.height = (int)alignSize(std::max(padding.height, 0), cacheStride.height);
    即padding的大小会自动适应stride的值。
  •  
    gz_ricky输入的图片是96*160的,对应了5.6 * 5, 经函数调整后变成6 * 5 =30
     
     所以对这张96*160的图片, 共有 3528 * 30 = 105840个特征向量
     
    PS,如果设置了padding的值,图片就会先伸展padding*2,或许是和内部那个paddingTL和paddingBR两个有关,即在Top-Left和Button-Right两个方向都扩展。计算特征数方法同上。
     

    hog特征值会生成以后,可以转入svm训练的阶段了。。。

### 回答1: HOG(Histogram of Oriented Gradients)是一种计算机视觉中的特征提取算法,常用于目标检测和行人识别等任务中。在Python中,可以使用OpenCV或scikit-image等库来实现HOG特征提取。 以scikit-image为例,可以通过以下代码实现HOG特征提取: ``` from skimage.feature import hog from skimage import data, exposure # 读取图像 image = data.astronaut() # 计算HOG特征 fd, hog_image = hog(image, orientations=8, pixels_per_cell=(16, 16), cells_per_block=(1, 1), visualize=True, multichannel=True) # 对HOG特征进行可视化 hog_image_rescaled = exposure.rescale_intensity(hog_image, in_range=(0, 10)) # 显示原始图像和HOG特征图像 import matplotlib.pyplot as plt fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4), sharex=True, sharey=True) ax1.axis('off') ax1.imshow(image, cmap=plt.cm.gray) ax1.set_title('Input image') hog_image_rescaled = exposure.rescale_intensity(hog_image, in_range=(0, 10)) ax2.axis('off') ax2.imshow(hog_image_rescaled, cmap=plt.cm.gray) ax2.set_title('Histogram of Oriented Gradients') plt.show() ``` 其中,`image`代表输入的图像,`orientations`指定方向的个数,`pixels_per_cell`指定每个细胞的像素数,`cells_per_block`指定每个块包含的细胞数。`fd`表示提取得到的HOG特征向量,`hog_image`表示HOG特征图像。最后,使用`matplotlib`库进行可视化,显示原始图像和HOG特征图像。 ### 回答2: HOG(Histogram of Oriented Gradients)特征提取是一种用于计算图像特征的方法,最初是由Navneet Dalal和Bill Triggs在2005年提出的。它在计算机视觉领域被广泛应用于物体检测和图像分类任务。 HOG特征提取的过程可以分为以下几个步骤: 1. 归一化图像大小:为了保持计算效率,首先需要将图像缩放为固定的大小。通常,使用缩放后的图像尺寸在64x128到128x256之间。 2. 计算梯度:对于每个像素,通过计算其在水平和垂直方向上的梯度,确定其梯度的大小和方向。这些梯度用于描述图像的边缘和纹理信息。 3. 划分图像为小单元:将缩放后的图像划分为一系列重叠的小单元。每个小单元通常为8x8像素。 4. 创建梯度方向直方图:对于每个小单元,根据其中像素的梯度方向和大小,创建梯度方向直方图。一个直方图通常包含9个方向的梯度值。 5. 归一化块:将相邻的若干小单元组合成块,并对每个块内的直方图进行归一化处理。这有助于提高特征的鲁棒性和可区分性。 6. 拼接特征向量:将所有块的特征向量拼接在一起,形成最终的HOG特征向量HOG特征提取通过描述图像中梯度的方向信息来提取特征,而不是关注像素的具体值。这使得HOG特征对于光照变化和几何变换相对不敏感,具有较好的鲁棒性。在图像处理和计算机视觉任务中,HOG特征已被广泛应用于人体检测、行人检测、物体识别等领域。 ### 回答3: HOG(方向梯度直方图)是一种计算机视觉领域常用的特征提取算法,它用于对图像进行描述和识别。Python中有各种库和模块可以用来实现HOG特征提取。 HOG特征提取的步骤如下: 1. 图像预处理:将图像转化为灰度图,如果图像尺寸较大,还可以进行降采样。 2. 计算图像的梯度:使用Sobel等算子计算图像在水平和竖直方向上的梯度。计算梯度的目的是为了检测图像中的边缘和纹理。 3. 划分图像为小的块(cells):将图像分割为大小固定的小块,每个小块包含多个像素。 4. 计算每个小块的梯度直方图:对于每个小块,统计其内像素的梯度方向和强度,并将其组织成直方图。 5. 归一化梯度直方图:对于每个小块的梯度直方图,可以对其进行归一化,使得特征对光照等变化更加不敏感。 6. 将小块的特征组合成一个全局的特征向量:将所有小块的特征向量进行串联,形成一个用于描述整个图像的全局特征向量。 通过以上步骤,我们可以得到一个用于描述图像的HOG特征向量。这个特征向量可以用于识别和分类任务,比如行人检测、物体识别等。 在Python中,我们可以使用第三方库如OpenCV或scikit-image来实现HOG特征提取。这些库提供了方便的函数和方法,可以直接使用。 例如,使用OpenCV库,我们可以使用以下代码来实现HOG特征提取: ```python import cv2 def hog_feature_extraction(image): # 图像预处理 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 创建HOG对象 hog = cv2.HOGDescriptor() # 计算HOG特征向量 features = hog.compute(gray) return features ``` 上述代码中,我们首先将彩色图像转换为灰度图像,然后创建一个HOG对象,并使用`compute`函数计算图像的HOG特征向量。 总结来说,Python中可以使用第三方库实现HOG特征提取,该特征提取方法可以用于图像描述和识别任务,具有良好的性能和鲁棒性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值