4. tereo Systems and Structure from Motion【cs231a课程笔记】

同系列链接

1. pinhole camera model【cs231a课程笔记】
2. Single View Metrology【cs231a课程笔记】
3. epipolar geometry【cs231a课程笔记】
4. tereo Systems and Structure from Motion【cs231a课程笔记】
5. Active and Volumetric Stereo【cs231a课程笔记】

4.1. tereo Systems and Structure from Motion

Triangulation三角剖分

已知两个相机内外参K,K‘,相机位置关系R,T,三维中的P投影为p和p’。

首先用 O 1 p O_1p O1p O 2 p ′ O_2p' O2p求出 l 和 l ′ l和l' ll,两线角点就是P

但是这个方法对p,p‘, O 1 , O 2 O_1,O_2 O1,O2的精度要求太高,一般预测P不准确,甚至有时两线不相交。

4.2. Triangulation三角剖分

4.2.1. linear method for triangulation

用两个点 p = M P = ( x , y , 1 ) p = MP = (x, y, 1) p=MP=(x,y,1) p ‘ = M ’ P = ( x ’ , y ‘ , 1 ) p‘ = M’ P = (x’, y‘, 1) p=MP=(x,y,1)

所以 p × ( M P ) = 0 p\times(MP)=0 p×(MP)=0,外积得0,写成下面的形式
在这里插入图片描述
化简为 A P = 0 AP=0 AP=0,A等于:
在这里插入图片描述
可以用SVD求解P点的最优估计

但这个方法不适用于projective reconstruction(投影重建),因为SVD要求||P||=1,但在投影变换中,P不是一个投影不变量。所以虽然简单,但通常不是三角剖分问题的最优解

4.2.2. nonlinear method for triangulation

非线性方法就是最优化下面的问题
在这里插入图片描述在这里插入图片描述

P ^ \widehat{P} P 是P的预测,最小化在两(多)个图片上的reprojectoin error重投影误差
sophisticated复杂

对于这种非线性最小二乘优化问题,有很多复杂技巧,但本课程只讲一个——Gaus-Newton算法。

非线性最小二乘优化问题通常表示( x ∈ R n x \in R^n xRn):
在这里插入图片描述

r i ( M ) 2 = ∣ ∣ M P ^ i − p i ∣ ∣ 2 r_i(M)^2=||M\widehat{P}_i-p_i||^2 ri(M)2=MP ipi2
r是residual function残差方程: R n → R m R^n \rightarrow R^m RnRm, r ( x ) = f ( x ) − y r(x)=f(x)-y r(x)=f(x)y.f(x)是线性,就是线性优化,反之亦然。

投影变换一般都是非线性,因为包含了齐次坐标系的一个维度。

如果将 e i e_i ei设为2x1的向量 e i = M P ^ i − p i e_i=M \widehat{P}_i-p_i ei=MP ipi,则有
在这里插入图片描述
用Gauss-Newton算法找最优解,关键思想是通过迭代找估计解 P ^ \widehat{P} P ,每一次迭代用一个更新值 δ P \delta_P δP: P ^ = P ^ + δ P \widehat{P} = \widehat{P} + \delta_P P =P +δP,又有(e()为error):
在这里插入图片描述
最小化问题转化为:
在这里插入图片描述
对于N张图片,我们有
在这里插入图片描述
其中
在这里插入图片描述
每一个 e i e_i ei都是2x1的向量,因为有两个维度x,y,所以e的维度是2Nx1
在这里插入图片描述
可以设立一个固定的值充当迭代的遍数

4.3. Affine structure from motion

SFM可以同时确定3D结构和相机参数

下面是基本模型,M是内外参
在这里插入图片描述
首先,我们只考虑仿射,简单些

所以对于M,v=0
在这里插入图片描述
就有:
在这里插入图片描述
我们可以进一步简化
在这里插入图片描述
然后可以用 M a f f i n e = [ A b ] M_{affine} = [A b] Maffine=[Ab]表示所有的仿射中的相机参数

我们可以发现,需要预测m个M矩阵,n个X三维坐标,一共8m+3n个未知量,有mn观测量,买个观测量有2个限制方程,一个2mn个限制方程。所以,当2mn>=8m+3n时,才有确定解。

那么当我们有足够的点时,该怎么解呢

4.3.1. The Tomasi and Kanade factorization method

因子分解法主要有两步,第一步是数据集中(centering),第二步才是因子分解

第一步:
我们定义
在这里插入图片描述

j是不同点的标号,i是不同相机的标号

由之前的关系又有:
在这里插入图片描述
于是有:
在这里插入图片描述
第二步:
我们有:
在这里插入图片描述
又因为D是M(2mx3)和S(3xn)的乘积,所以rank(D)=3

为了,将D分解为M和S,我们用SVD, D = U Σ V T D=U\Sigma V^T D=UΣVT.所以:
在这里插入图片描述
虽然实际中rank(D)>3,由于噪声的存在,但这个结果依然是MS的最优估计

那么具体M和S是什么呢,在两人的论文中,给出了一个取中的解:
在这里插入图片描述

4.3.2. Ambiguity in reconstruction

我们选择用一个3x3的矩阵A,替换 Σ \Sigma Σ:
在这里插入图片描述
所以解不是确定的,我们要通过更多的限制条件解。

我们需要标定板上的已知大小,去确定A

4.4. Perspective structure from motion

一般情况(映射变换)
在这里插入图片描述
类似于affine的情况,我们有2mn个限制方程,有11m+3n-15个未知量。

15是因为相机和点只能恢复到4x4的投影变换?

4.4.1. The algebraic approach

leverage 杠杆作用,利用
canonical(最简洁的) matrix 规范矩阵(对角线元素只能是0,1,-1)
geometrical interpretation 几何解释

该方法利用基本矩阵F解决相机之间的运动问题
有一个投影变换H,使得:
在这里插入图片描述
首先计算基本矩阵F,定义 P ~ = H P \widetilde{P}=HP P =HP,有:
在这里插入图片描述
可以推出
在这里插入图片描述
我们做cross product 叉乘
在这里插入图片描述
又由于 p ′ × b p'\times b p×b垂直与 p ′ p' p,有:
在这里插入图片描述
又由于 p ′ T F p = 0 p'^TFp=0 pTFp=0,所以
在这里插入图片描述
我们计算Fb
在这里插入图片描述
发现等于0,由于F是奇异的,b是一个最小二乘解,当 ∣ ∣ b ∣ ∣ = 1 ||b||=1 b=1,用SVD

b知道后,可以计算A, A = − [ b ] X F A=-[b]_XF A=[b]XF,证明
在这里插入图片描述
所以,我们重新定义 M 1 H − 1 , M 2 H − 1 M_1H^{-1}, M_2H^{-1} M1H1,M2H1
在这里插入图片描述
接下来我们给出b的几何解释,在对极几何里,我们有极点与基本矩阵F点积为0, F e 2 = 0 , F T e 1 = 0 Fe_2=0, F^Te_1=0 Fe2=0,FTe1=0,所以,b也是一个极点。所以上式有另一种形式
在这里插入图片描述

4.4.2. Determining motion from the Essential matrix

skew-symmetric 斜对称

更精确的方式是用本质矩阵,假设我们知道了相机的内参K
在这里插入图片描述
可以由旋转矩阵R和平移向量t表示:
在这里插入图片描述
我们定义两个将会在分解时用到的矩阵
在这里插入图片描述
有几个特性
在这里插入图片描述
在这里插入图片描述
作为特征值分解的结果,我们可以创建按比例缩放的一般斜对称矩阵的块分解,所以,我们可以有
在这里插入图片描述
所以E:
在这里插入图片描述
因为E的特征值分解结果 E = U Σ V T = U d i a g ( 1 , 1 , 0 ) V T E=U\Sigma V^T=Udiag(1,1,0)V^T E=UΣVT=Udiag(1,1,0)VT,所以
在这里插入图片描述
证明:R的特征值分解只能是 R = U X Y T R=UXY^T R=UXYT,有 Z X = d i a g ( 1 , 1 , 0 ) ZX=diag(1,1,0) ZX=diag(1,1,0),所以 X = W 或 W T X=W或W^T X=WWT

为了保证R是一个旋转矩阵,所以(det是行列式):
在这里插入图片描述
类似于R,t可能取几个值,我们已经知道
在这里插入图片描述
U是酉矩阵(unitary matrix https://blog.youkuaiyun.com/sayaitachi/article/details/77749613),我们发现 ∣ ∣ [ t ] X ∣ ∣ F = 2 ||[t]_X||_F= \sqrt{2} [t]XF=2 ,由于上诉的等式及E按比例已知,我们有
在这里插入图片描述
一共有四种可能,但只有a点在两相机同侧。
在这里插入图片描述
一般来讲,我们只需三角剖分一个点,就可得到R,T,但因为噪声误差,实际用多个点。

4.5. An example structure from motion pipeline

up to scale:只差一个比例因子(不知道像素点与实际大小的关系)

4.5.1. Bundle adjustment(光束平差法 BA)

factorization method分解法 假设所有点都是可见的

后来用代数方法,但不能解决使用所有摄像机和3D点进行连贯优化的重建的问题。

用BA——SFM的非线性方法可以克服困难。

最小化重投影误差,只需要可见点(不需要所有点)

常见算法有Gauss-Newton算法,Levenberg-Marquardt算法

对初始条件要求高(否则可能到局部最优,或不收敛),所以一般接在其他方法后面。

地形数据测量是许多地貌研究应用程序的基本方面,尤其是那些包括地形监测和地形变化研究的应用程序。然而,大多数测量技术需要相对昂贵的技术或专门的用户监督。 Motion(SfM)摄影测量技术的结构通过允许使用消费级数码相机和高度自动化的数据处理(可以免费使用)减少了这两个限制。因此,SfM摄影测量法提供了快速,自动化和低成本获取3D数据的可能性,这不可避免地引起了地貌界的极大兴趣。在此贡献中,介绍了SfM摄影测量的基本概念,同时也承认了其传统。举几个例子来说明SfM在地貌研究中的应用潜力。特别是,SfM摄影测量为地貌学家提供了一种工具,用于在一定范围内对3-D形式进行高分辨率表征,并用于变化检测。 SfM数据处理的高度自动化既创造了机遇,也带来了威胁,特别是因为用户控制倾向于将重点放在最终产品的可视化上,而不是固有的数据质量上。因此,这项贡献旨在指导潜在的新用户成功地将SfM应用于一系列地貌研究。 关键词:运动结构,近距离摄影测量,智能手机技术,测量系统,表面形态echnology reduces both these constraints by allowing the use of consumer grade digital cameras and highly automated data processing, which can be free to use. SfM photogrammetry therefore offers the possibility of fast, automated and low-cost acquisition of 3-D data, which has inevitably created great interest amongst the geomorphological community. In this contribution, the basic concepts of SfM photogrammetry are presented, whilst recognising its heritage. A few examples are employed to illustrate the potential of SfM applications for geomorphological research. In particular, SfM photogrammetry offers to geomorphologists a tool for high-resolution characterisation of 3-D forms at a range of scales and for change detection purposes. The high level of automation of SfM data processing creates both opportunities and threats, particularly because user control tends to focus upon visualisation of the final product rather than upon inherent data quality. Accordingly, this contribution seeks to guide potential new users in successfully applying SfM for a range of geomorphic studies.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值