Multi-Viewpoint Panorama Construction With Wide-Baseline Images Images
简介
文章源自IEEE TRANSACTIONS ON IMAGE PROCESSING
在这篇论文中,我们提出了一种用于广角基线图像的拼接方法。我们的主要贡献是采用基于网格的框架,结合各种项来优化图像对齐。引入了一种新颖的尺度保持项,使得对齐几乎平行于图像平面,同时仍允许进行局部透视校正。一种新的接缝切割模型减少了由于难以处理传统接缝切割算法[8],[9]中的误对齐而引起的视觉伪影。图1展示了一个具有挑战性的城市场景示例,其中包含了14张在不同位置拍摄的图像。我们生成的全景图具有视觉吸引力。
1.主要工作
1.特征匹配后离群点剔除
2.网格优化,设计了新的约束项
3.接缝生成,在传统的色差的基础上添加了对准误差作为约束项
2.离群点剔除
对于每个特征点,我们假设在它的局部区域有一个平面,所以所有的邻居都近似在同一个平面上。对于任意两个特征点,当其距离小于 r r r时,我们将其视为相邻点。我们使用DLT[29]对所有相邻特征对应拟合一个单应性,并计算残差。如果误差小于阈值γ,我们将其标记为内线。在我们的实验中,我们一般设 R R R = 50, γ γ γ = 5。

3.网格优化
target图进行网格化,顶点索引:
V = [ x 1 y 1 x 2 y 2 … x m y m ] ⊤ V=\left[\begin{array}{lllllll} x_1 & y_1 & x_2 & y_2 & \ldots & x_m & y_m \end{array}\right]^{\top} V=[x1y1x2y2…xmym]⊤
总的能量函数如下:
E ( V ) = E A ( V ) + λ R E R ( V ) + λ S E S ( V ) + E X ( V ) E(V)=E_A(V)+\lambda_R E_R(V)+\lambda_S E_S(V)+E_X(V) E(V)=EA(V)+λRER(V)+λSES(V)+EX(V)
其中
E A ( V ) E_A(V) EA(V)为对齐项,强制相应的特征点被弯曲到相同的位置。
E R ( V ) E_R(V) ER(V)是正则化项,鼓励相邻的顶点进行相似的变换。
E S ( V ) E_S(V) ES(V)为尺度项,防止图像尺度变化较大。
λ R λ_R λR和 λ S λ_S λS是权值,在我们的系统中通常设为1。
E X ( V ) E_X(V) EX(V)是一个可选的额外约束,用于更强的正则化。
3.1 Feature Alignment —— E A ( V ) E_A(V) EA(V)

将每个特征点表示为
四个外围控制顶点的加权和,并使所有特征点的对齐误差最小化。与[16]类似,我们使用双线性插值计算原始网格上的权值,相当于重心表示。
表达式如下: w 1 = ( v 3 x − p x ) ( v 3 y − p y ) , w 2 = ( p x − v 4 x ) ( v 4 y − p y ) , w 3 = ( p x − v 1 x ) ( p y − v 1 y ) , w 4 = ( v 2 x − p x ) ( p y − v 2 y ) . \begin{aligned} & w_1=\left(v_{3 x}-p_x\right)\left(v_{3 y}-p_y\right), \\ & w_2=\left(p_x-v_{4 x}\right)\left(v_{4 y}-p_y\right), \\ & w_3=\left(p_x-v_{1 x}\right)\left(p_y-v_{1 y}\right), \\ & w_4=\left(v_{2 x}-p_x\right)\left(p_y-v_{2 y}\right) . \end{aligned} w1=(v3x−px)(v3y−py),w2=(px−v4x)(v4y−py),w3=(px−v1x)(py−v1y),w4=(v2x−px)(py−v2y).
这里我们基于这样一个假设:当网格较小时,对其进行透视投影变换时,可以近似看作仿射变换,即前面提到的权重是不变的。
对于target图上的点 p i p_i pi,以及reference图上与之匹配的点 p j p_j pj,在经过网格变形后这一对匹配点将投影到同一画布上得到 p i ∗ p_i^* pi∗和 q i ∗ q_i^* qi∗,我们希望的是他们两尽量重合,所以有了下面约束项:
E A ( V ) = ∑ ( p i , p j ) ∈ C 1 N p i , p j ∥ p i ∗ − q i ∗ ∥ 2 = ∑ ( p i , p j ) ∈ C 1 N p i , p j ∥ W i V − W j V ∥ 2 \begin{aligned} E_A(V) & =\sum_{\left(p_i, p_j\right) \in C} \frac{1}{N_{p_i, p_j}}\left\|p_i^*-q_i^*\right\|^2 \\ & =\sum_{\left(p_i, p_j\right) \in C} \frac{1}{N_{p_i, p_j}}\left\|W_i V-W_j V\right\|^2 \end{aligned} EA(V)=(pi,pj)∈C∑Npi,pj1∥pi∗−qi∗∥2=(pi,pj)∈C∑Npi,pj1∥WiV−WjV∥2
其中 C C C是所有匹配对的集合
W i W_i Wi是 p i p_i pi的一个2m×2权值矩阵:
[ … w 1 0 … w 2 0 … w 3 0 … w 4 0 … … 0 w 1 … 0 w 2 … 0 w 3 … 0 w 4 … ] \left[\begin{array}{ccccccccccccc} \ldots & w_1 & 0 & \ldots & w_2 & 0 & \ldots & w_3 & 0 & \ldots & w_4 & 0 & \ldots \\ \ldots & 0 & w_1 & \ldots & 0 & w_2 & \ldots & 0 & w_3 & \ldots & 0 & w_4 & \ldots \end{array}\right] [……w100w1……w200w2……w300w3

文章提出一种用于广角基线图像的拼接方法,采用基于网格的框架优化图像对齐。主要工作包括离群点剔除、网格优化、接缝生成。通过设计新约束项、优化能量函数等操作,虽接缝效果未明显优于传统图割法,但加入保线和方向约束后,图片直线扭曲现象改善。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



