全向相机网络中的球面成像技术解析
1. 引言
如今,三维视觉内容的呈现大多局限于平面投影,这种方式犹如为观察者提供了一扇窥视世界的小窗。自第一幅画作诞生以来,我们的思维就深受这种观念的束缚。然而,平面投影在构建精确的三维环境模型时存在显著局限性,因为光本质上是以辐射形式传播的。
动态视觉的基础以及坚实的数学基石是全光函数(PF),它用于测量场景中所有位置和所有方向的光强度。在静态场景中,该函数与时间无关,可将其定义为在乘积流形 $R^3 \times S^2$ 上的函数(为简便起见,忽略色度分量),其中 $S^2$ 是二维球面。我们可以把全光函数视为理想视觉传感器的模型,因此在球面上处理视觉信息变得极具吸引力。
当前大多数先进技术会先将全光信息映射到一组欧几里得视图,用欧几里得坐标 $(u, v) \approx (\theta, \varphi)$ 替代球面坐标,然后使用常规图像处理算法处理这些图像。但这种处理方式限制了图像处理应用的范围和功能,因为欧几里得近似仅在局部或小尺度下有效,而全光函数的重要特性是能在所有尺度和方向上全局地涵盖信息。所以,要么需要处理大量近似全光函数的常规图像,要么会面临欧几里得近似与实际全光函数之间出现巨大差异的问题。为避免平面投影带来的局限性,在球面上处理视觉信息是一个不错的选择。此外,人类视网膜中央凹中光感受器的辐射状排列也提示我们应重新思考视觉信息的获取和采样方式,摆脱传统的矩形采样平面成像。
全向视觉传感器在图像和三维场景表示方面具有巨大潜力和优势,它能提供 360 度的视野(FOV)。在全向成像领域,已经为不同目的开发了众多高效的工具和方法,包括图像压缩、重建、监控、计算机视觉和机器人技术等。本文重点关注具有单投影点的全
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



