基于梯度的密集采样稀疏特征对齐方法解析
1. 符号说明
在开始之前,先对后续会用到的符号进行说明:
- 常规字体符号(如 n、N)表示标量,小写用于索引,大写用于表示范围或维度。
- 小写粗体符号(如 x)表示向量。
- 大写粗体符号(如 J)表示矩阵。
- 大写花体符号(如 I)表示函数。
我们将图像视为函数而非向量或矩阵,这样可以通过亚像素插值来处理非整数像素,因为变形函数的输出坐标可能是实值。符号 (I: R^{D\times2} \to R^D) 表示对 (D) 个(亚)像素的采样。为了使符号简洁且更易读,我们常对表达式进行向量化处理,很多情况下函数返回值是向量。
2. 引言
对象或图像对齐问题,是要找到一组参数 (\Delta x),使输入图像 (I) 与对象或图像模型达到最优对齐,即:
(\Delta x^* = \arg \min_{\Delta x} D{I(x + \Delta x)} + A{\Delta x}) (1)
在这个广义的对齐定义下,可衍生出计算机视觉中常见的光流、姿态估计、面部特征点拟合、可变形部件建模和无监督对齐等具体模型。其中:
- (D: R^D \to R) 是连续损失函数,用于衡量图像观测与模型的拟合程度。
- (I: R^{D\times2} \to R^D) 是图像函数,用于在给定位置采样(亚)像素值。
- (A: R^{2D} \to R) 是正则化函数,会对每个可能的变形向量 (\Delta x) 进行惩罚。
由于像素强度在估计对象/部件相似度方面表现不佳,在对齐策略中,通常会使用特征映
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



