2D与3D视觉形成解析
1. 2D与3D视觉差异概述
在视觉领域,一张场景图像和从不同视角拍摄的同一场景的两张图像有着本质区别。当我们拥有同一场景在不同相机位置拍摄的两个或更多视角的图像时,就可以通过几何方法推断出深度信息,这个过程被称为三角测量,能够恢复三维(3D)信息。这也是人类拥有两只眼睛能带来不同视觉体验的原因。
2. 人类视觉系统
经过数百万年的进化,人类视觉系统(HVS)成为了地球上最精妙、神秘的立体深度感知引擎。视觉过程始于眼睛,以下是眼睛的相关结构和功能:
- 眼睛结构与光线调节 :入射光首先通过瞳孔,瞳孔由虹膜瞳孔括约肌控制其大小,从而调节进入眼睛晶状体的光量。瞳孔孔径越大,眼睛的球面像差越大,景深越小。视觉轴连接注视点和中央凹,虽然眼睛并非旋转对称,但可近似定义一条连接角膜曲率中心和晶状体中心的光轴,二者夹角约为5°。需要注意的是,眼睛实际上是大脑150mm的延伸,在计算机视觉中,眼睛最重要的部分是视网膜,它能将进入的光子流转化为相应的神经兴奋。
- 双眼视觉与深度感知 :在双眼视觉和立体深度感知中,双眼需要汇聚,使同一场景区域投射到各自的中央凹。视网膜上周围3D点的图像与中央凹的距离关系很关键。当两个视网膜上的图像点到各自中央凹的距离相同时,它们是对应点。例如,在特定模型中,点P1和P2的左右视网膜图像到中央凹的距离相同,而点Q则不同,人类视觉系统能据此判断Q离视野单像区更远。视野单像区是指视网膜图像到两个中央凹距离相同的3D区域,该区域的点视网膜视差为零,视网膜视差用于评估世界中3D位置的距离。
- 视觉信号传递与处理
超级会员免费看
订阅专栏 解锁全文
6708

被折叠的 条评论
为什么被折叠?



