图像描述符与降维技术详解
1. 图像描述符
1.1 SIFT描述符
SIFT(尺度不变特征变换)描述符是一种用于描述图像局部特征的方法。其计算过程如下:
- 计算兴趣点周围区域内每个像素的梯度。
- 将该区域划分为多个单元格。
- 在每个单元格内汇总信息,形成一个8维直方图。
- 将这些直方图连接起来,得到最终的描述符。
这个描述符能够捕捉局部特征,对小的变形具有不变性,同时保留了图像梯度的一些空间信息。例如,在原始的SIFT检测器实现中,一个16×16的图像块会被划分为4×4的单元格网格。
1.2 方向梯度直方图(HOG)描述符
HOG描述符旨在用小的图像窗口构建更详细的空间结构特征。它适用于检测具有准规则结构的物体,如行人。计算适合行人检测的HOG描述符的步骤如下:
1. 使用公式计算64×128窗口内每个像素的图像梯度的方向和幅度。
2. 将方向量化为9个区间,范围从0°到180°。
3. 将64×128的检测区域划分为规则的、重叠的6×6单元格网格。
4. 在每个单元格内计算一个9维的方向直方图,直方图的贡献由梯度幅度和到单元格中心的距离加权,使得中心像素的贡献更大。
5. 对于每个3×3的单元格块,将描述符连接并归一化,形成块描述符。
6. 将所有块描述符连接起来,形成最终的HOG描述符。
最终的描述符包含了局部梯度的空间汇总信息,同时保持了一定的空间分辨率。它通过仅使用梯度幅度实现了对对比度极性的不变性,通过相对于每个块进行归一化实现了对局部对比度强度的不变性。与SIFT描述符相比,HOG描述符对对比度
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



