本系列的博客主要基于这学期参加的computer vision的选修课,本课程的vision特指中层视觉,不含图像处理与机器学习。本文的目的,是想给一些准备入门的同学,介绍一下vision中关于motion部分的计算机视觉发展史,看看前辈们是如何提出一个大问题,又是通过加入哪些assumptions去解决这些问题,而后辈们又是如何突破这些asuumption的限制获得泛化能力更强的解的。
Calculating Optical Flow的重要工作完成于上世纪80年代初,分别是从局部入手的Locas-Kanade’s Method和从全局入手的Horn-Schunck’s Method,它的作用是可以通过计算物体2D移动,进而求解3D移动,对机器人的实时跟踪等算法具有重要的意义。
首先介绍一下Motion field (运动场)and optical flow(光流)
概念一:Motion field (2D): a velocity vector associated with each image point
大家可以这样理解,一个在3D空间内运动的物体,通过投影成像在底片或者视网膜等2D平面上的像素点,随着3D的运动而运动,因为有方向有大小,也就是向量了。
P.S. 这里需要讲一下3D motion与2D motion之间相互关系,这在以后的博客关于从2D motion到3D motion转化的时候会用到。首先看一下下面这个图,左图是我们常用的投影perspective projection(透视投影)的习惯画法,有些人把这个模型想不明白,其实真正的模型是右边那个(给机械的丢脸了)。<