图像对齐的方法与度量探究
1. EMMA算法
EMMA 即“经验熵操作与分析”,是 Viola 和 Wells 提出的一种基于互信息最大化的对齐方法。为了最大化互信息(公式 4.6),需要估计其关于变换 $T$ 的导数:
$\frac{\partial}{\partial T} I(u(x), v(T(x))) = \frac{\partial}{\partial T} H(v(T(x))) - \frac{\partial}{\partial T} H(u(x), v(T(x)))$
$\approx\frac{1}{N_b} \sum_{x_b\in b} \sum_{x_a\in a} (v_b - v_a)T^2 [W_v(v_i, v_j)\psi^{-1} v - W {uv}(w_i, w_j)\psi^{-1}_{vv}] \frac{\partial}{\partial T} (v_b - v_a)$
这里,$v_i$ 表示 $v(T(x_i))$,$w_i$ 表示 $[u(x_i), v(T(x_i))]^T$ 用于联合密度。联合密度的核宽度是块对角的:$\psi^{-1} {uv} = Diag(\psi^{-1} {uu}, \psi^{-1}_{vv})$。在最后一个因子中,$(v(T(x_b)) - v(T(x_a)))$ 必须关于 $T$ 求导,所以导数的表达式取决于所涉及的变换类型。
给定导数后,可以进行梯度下降。EMMA 算法执行梯度下降的随机模拟,这种随机近似避免陷入局部最小值。以下算法在样本大小 $N_a$、$N_b$ 约为 50 个样本时能成功实现对齐:
1. $A
超级会员免费看
订阅专栏 解锁全文
1829

被折叠的 条评论
为什么被折叠?



