单应性(homography)变换的公式推导过程

本文详细介绍了单应性变换的概念及其在图像处理中的应用。通过数学推导展示了如何利用四对对应点计算单应性矩阵,并给出了具体的实现步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文地址:http://www.cnblogs.com/ml-cv/p/5871052.html


矩阵的一个重要作用是将空间中的点变换到另一个空间中。这个作用在国内的《线性代数》教学中基本没有介绍。要能形像地理解这一作用,比较直观的方法就是图像变换,图像变换的方法很多,单应性变换是其中一种方法,单应性变换会涉及到单应性矩阵。单应性变换的目标是通过给定的几个点(通常是4对点)来得到单应性矩阵。下面单应性矩阵的推导过程。

H=h11h21h31h12h22h32h13h23h33 H=[h11h12h13h21h22h23h31h32h33]

矩阵 H H会将一幅图像上的一个点的坐标 a=(x,y,1) a=(x,y,1)映射成另一幅图像上的点的坐标 b=(x1,y1,1) b=(x1,y1,1),也就是说,我们已知 a a b b,它们是在同一平面上。 则有下面的公式:
b=HaT(1) (1)b=HaT

即:
x1=h11x+h12y+h13y1=h21x+h22y+h231=h31x+h32y+h33(2) (2){x1=h11x+h12y+h13y1=h21x+h22y+h231=h31x+h32y+h33

由上面这个公式中的 1=h31x+h32y+h33 1=h31x+h32y+h33可得到下面两个等式
x1=x11=h11x+h12y+h13h31x+h32y+h33y1=y11=h21x+h22y+h23h31x+h32y+h33(3) (3){x1=x11=h11x+h12y+h13h31x+h32y+h33y1=y11=h21x+h22y+h23h31x+h32y+h33


{h11x+h12y+h13=h31xx1+h32yx1+h33x1h21x+h22y+h23=h31xy1+h32yy1+h33y1(4) (4){h11x+h12y+h13=h31xx1+h32yx1+h33x1h21x+h22y+h23=h31xy1+h32yy1+h33y1


{0=h31xx1+h32yx1+h33x1(h11x+h12y+h13)0=h31xy1+h32yy1+h33y1(h21x+h22y+h23)(5) (5){0=h31xx1+h32yx1+h33x1−(h11x+h12y+h13)0=h31xy1+h32yy1+h33y1−(h21x+h22y+h23)

对于方程 (???) (???) ,可写成一个矩阵与一个向量相乘,即:
[x0y0100x0y01xx1xy1yx1yy1x1y1]h=0(6) (6)[−x−y−1000xx1yx1x1000−x−y−1xy1yy1y1]h=0

其中, h=[h11,h12,h13,h21,h22,h23,h31,h32,h33]T h=[h11,h12,h13,h21,h22,h23,h31,h32,h33]T,是一个9维的列向量。若令:
A=[x0y0100x0y01xx1xy1yx1yy1x1y1](7) (7)A=[−x−y−1000xx1yx1x1000−x−y−1xy1yy1y1]

(6) (6)可以记为
Ah=0(8) (8)Ah=0

这里的 AR2×9 A∈R2×9。这只是1对点所得到的矩阵 A A,若有4对点,则得到的矩阵 AR8×9 A∈R8×9。如何求解向量 h h呢?方法很简单,真接对 A A进行SVD分解,即
UΣVT(9) (9)U∗Σ∗VT

然后取 V V的最后一列出来作为求解 h h。因为矩阵 A A是行满秩,即只有一个自由度。
具体实现时,先要得到两幅图,然后在两幅图之间找到4对点的坐标,由此得到矩阵 A A,然后在matlab中可以这样实现:

[U,S,V]=svd(A);

h=V(:,9);

H= reshape(h,3,3);

由单应性矩阵可以得到仿射变换,还可以在单应性矩阵上做图像拼接。


### 单应性变换的数学推导过程 在计算机视觉和图像处理领域,单应性变换Homography Transformation)用于描述两个平面之间的投影关系。这种变换通常应用于校正透视失真、拼接全景图以及增强现实等领域。 #### 定义和平面间的映射关系 假设存在两幅图像 \( I_1 \) 和 \( I_2 \),它们分别对应于同一场景的不同视角下的观测结果。如果这两张图片中的物体位于同一个平面上,则可以通过一个3×3矩阵H来建立两者像素坐标的映射关系: \[ p'_i = H * p_i \] 其中\(p_i\)代表原图上的点坐标向量,而\(p'_i\)则是目标图像中对应的点位置[^1]。 #### 参数化形式 具体来说,该线性变换可由如下齐次坐标表达式给出: \[ \begin{bmatrix} x' \\ y' \\ w' \end{bmatrix} = \begin{bmatrix} h_{11} & h_{12} & h_{13}\\ h_{21} & h_{22} & h_{23}\\ h_{31} & h_{32} & h_{33} \end{bmatrix} * \begin{bmatrix} x\\ y\\ 1 \end{bmatrix}, (x', y')=\left(\frac{x'}{w'},\frac{y'}{w'}\right) \] 这里需要注意的是,在实际应用过程中我们往往只关心前8个参数(hij,i=1~3,j=1~3),因为最后一个元素h33总是设为1以简化计算。 #### 解决最小二乘问题求解未知数 当给定至少四组匹配好的特征点对时(即n≥4),就可以利用这些已知条件构建超定方程组并通过SVD分解或其他优化方法得到最优解H*。对于每一个配对(xi,yi)->(xi′,yi′): \[ A= \begin{bmatrix} -x_i&-y_i&-1&0&0&0&x_ix'_i&y_ix'_i&x'_i\\ 0&0&0&-x_i&-y_i&-1&x_iy'_i&y_iy'_i&y'_i \end{bmatrix}, b=[0; 0], Ah=b \] 最终通过上述公式联立求得满足误差平方和最小化的单应性矩阵H*。 ```python import numpy as np from scipy.linalg import svd def compute_homography(src_pts,dst_pts): A = [] for i in range(len(src_pts)): x, y = src_pts[i][0], src_pts[i][1] u, v = dst_pts[i][0], dst_pts[i][1] row1 = [-x,-y,-1,0,0,0,x*u,y*u,u] row2 = [0,0,0,-x,-y,-1,x*v,y*v,v] A.append(row1) A.append(row2) _,_,VT = svd(np.array(A)) L = VT[-1,:] / (VT[-1,-1]) H = L.reshape(3,3) return H[:2,:]/H[2,2] ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值