眼动追踪与视差深度解析
1. 视觉搜索与眼动基础
视觉搜索是在场景中寻找目标的行为。当场景视角在 2 度到 30 度之间时,眼睛会移动来寻找目标;若场景更大,头部也会随之移动。在日常生活中,视觉搜索任务极为频繁,对大多数正常任务而言,它已成为一种应激性而非深思熟虑的过程。
人类眼睛的视觉响应并不均匀,最佳视力仅存在于 1 到 2 度的视角范围内,这被称为中央凹视觉。中央凹位于视网膜黄斑区域的中心,其中心的“中央凹坑”含有比视网膜其他部分更高浓度的视锥细胞,且没有视杆细胞。在注视时,眼球晶状体将注视区域聚焦到中央凹上。而对于观察场景时未直接注视的区域,我们只能依靠非中央凹视觉提供的较为粗略的物体表征,其视觉敏锐度从焦点中心急剧下降。
当我们试图理解一个场景时,并非随机扫描,而是将眼睛固定在特定区域并在它们之间移动。常见的眼动类型如下:
- 扫视(Saccadic) :这是一种主动的快速眼动,用于将中央凹对准特定的兴趣点。扫视具有约 40,000°/s² 的快速加速度和 600°/s 的峰值速度,在 1 到 40 度的视觉搜索中较为常见,其目的是使搜索场景中的特定感兴趣区域落在中央凹上,中央凹的有效范围为 0.6 到 1 度。
- 微小运动(Miniature) :这是一组不自主的眼动,会使眼睛产生抖动效果,包括漂移和微扫视。微小眼动幅度小于 1 度,这类小幅度眼动限制了眼动追踪技术的精度下限,通常认为精度超过 0.5 度并非必要。
- 追踪(Pursuit) :这是一种平滑的不自主眼动,用于使移动的物体保持在中央凹上。
-