计算机视觉中的运动分析:从基础到未来应用
1. 视觉系统运动检测模型概述
视觉系统中用于运动检测的模型性质一直是大量思考和研究的主题。目前最被广泛接受的模型有Adelson和Bergen提出的,以及Watson和Ahumada提出的。然而,对于这些机制如何引发视动错觉和光流,并没有明确的共识。此外,关于运动滤波器的操作模式以及如何组合它们的输出来确定二维运动的方向,也存在分歧。而且,很难明确特征跟踪机制和运动传感机制在性能上的差异。
在神经生物学领域,Semir Zeki的研究使视觉皮层功能专业化的概念得到认可。在视觉皮层中,颜色、形状和运动是分开处理的。有四个并行系统处理视觉的不同属性:一个用于运动,一个用于颜色,两个用于形状。值得注意的是,运动系统和颜色系统在计算上是最不同的两个通道。对于人类视觉运动系统来说,大脑的关键区域是V5区,该区域受损会导致运动盲,患者无法看到或理解运动的世界。静止时,物体看起来清晰可见,但相对于它们的运动却会使物体消失。
2. 计算机视觉中运动研究的开端
早期计算机视觉中对运动的研究源于从卫星图像序列中确定云的运动问题。由于难以近似云的形状和运动,研究人员将其理想化,假设云的运动由不同层次的多边形独立移动组成,观察到的云运动视图是各层多边形图形的重叠视图。为了确定多边形的线速度和角速度,并将图像序列分解为多个分量图像序列,假设多边形是刚性的。实际上,云既不是多边形也不是刚性的,它们会改变形状、出现和消失。但这项研究揭示了关于重叠多边形图形的一些有趣且基本的关系。
研究产生了两个程序,一个用于从不同层的移动多边形生成图像序列,另一个(分析程序)用于系统地分析生成的多边形图像序列的叠加。分析程序能够正确构建底
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



