计算机视觉中的运动分析:从基础到未来应用
1. 视觉系统中运动检测模型概述
视觉系统中用于运动检测的模型性质一直是研究热点。目前,Adelson 和 Bergen 以及 Watson 和 Ahumada 提出的模型被广泛接受,但对于这些机制如何引发视动效应和光流,尚无明确共识。同时,在运动滤波器的工作模式以及如何组合其输出来确定二维运动方向方面,也存在分歧。此外,很难明确特征跟踪机制和运动传感机制在性能上的差异。
在神经生物学领域,Semir Zeki 的研究使人们接受了视觉皮层功能专业化的概念,即颜色、形状和运动分别由不同系统处理。视觉由四个并行系统处理不同属性:一个处理运动,一个处理颜色,两个处理形状。其中,运动和颜色系统在计算上差异最为明显。对于人类视觉运动系统,大脑的关键区域是 V5,该区域受损会导致运动盲,患者无法感知和理解运动中的世界,静止物体清晰可见,但相对运动时物体就会消失。
2. 计算机视觉中运动研究的开端
计算机视觉中运动研究的开端源于通过卫星图像序列确定云运动的问题。由于难以近似云和云的运动,研究人员将其理想化,假设云是在平面中移动的多边形。这些多边形在不同层次独立移动,观察到的云运动是不同层次多边形图形的重叠视图。为了确定多边形的线速度和角速度,并将图像序列分解为组件序列,假设多边形是刚性的。
虽然实际中的云既不是多边形也不是刚性的,但这项研究揭示了有关叠加多边形图形的一些有趣且基本的关系。研究产生了两个程序:一个用于从不同层的移动多边形生成图像序列,另一个(分析程序)用于系统地分析生成的多边形图像序列叠加。分析程序能够正确构建底层多边形的描述,跟踪多边形使用的特征包括顶点、顶点处的夹角和多边形的边长。
超级会员免费看
订阅专栏 解锁全文
24万+

被折叠的 条评论
为什么被折叠?



