14、基于梯度的密集采样稀疏特征对齐方法解析

sql99

于 2025-11-02 13:01:25 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：密集对应：视觉的桥梁文章标签：梯度估计密集采样稀疏特征 HOG

本文链接：https://blog.youkuaiyun.com/sql99/article/details/154925185

密集对应：视觉的桥梁专栏收录该内容

29 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于梯度的密集采样稀疏特征对齐方法解析

1. 符号说明

在开始之前，先对后续会用到的符号进行说明：
- 常规字体符号（如 n、N）表示标量，小写用于索引，大写用于表示范围或维度。
- 小写粗体符号（如 x）表示向量。
- 大写粗体符号（如 J）表示矩阵。
- 大写花体符号（如 I）表示函数。

我们将图像视为函数而非向量或矩阵，这样可以通过亚像素插值来处理非整数像素，因为变形函数的输出坐标可能是实值。符号 (I: R^{D\times2} \to R^D) 表示对 (D) 个（亚）像素的采样。为了使符号简洁且更易读，我们常对表达式进行向量化处理，很多情况下函数返回值是向量。

2. 引言

对象或图像对齐问题，是要找到一组参数 (\Delta x)，使输入图像 (I) 与对象或图像模型达到最优对齐，即：
(\Delta x^* = \arg \min_{\Delta x} D{I(x + \Delta x)} + A{\Delta x}) (1)

在这个广义的对齐定义下，可衍生出计算机视觉中常见的光流、姿态估计、面部特征点拟合、可变形部件建模和无监督对齐等具体模型。其中：
- (D: R^D \to R) 是连续损失函数，用于衡量图像观测与模型的拟合程度。
- (I: R^{D\times2} \to R^D) 是图像函数，用于在给定位置采样（亚）像素值。
- (A: R^{2D} \to R) 是正则化函数，会对每个可能的变形向量 (\Delta x) 进行惩罚。

由于像素强度在估计对象/部件相似度方面表现不佳，在对齐策略中，通常会使用特征映