脑启发感知、运动与控制:视频监控新视角
1. 背景
人类大脑的巨大潜力不仅源于其较大的体积,还在于对感知信息的脑启发式计算和再分析,其中视觉信息占比超 70%。与人类大脑不同,机器大脑通过收集视频和图像来获取视觉信息。视频监控、检查机器人和安保机器人在维护全球社会稳定、公共安全和保护基础设施方面发挥着至关重要的作用。
然而,目前在危险理解和识别方面仍存在大量不确定性,例如“谁处于危险中”以及“谁是危险的来源”。这部分归因于环境条件对监控系统视频识别效率的影响,特别是在复杂环境中的关键工程应用。多变的环境会降低大多数在线算法的效率,不同环境下在线算法的合适模型参数可能有很大差异。此外,视频监控任务难度的不同也要求在线视频识别算法具备自适应性。
这些差异和困难主要源于周围环境变化导致的背景变化,这也是物体识别和跟踪中一些重要但尚未解决问题的根本原因。在不受控的环境变化中,背景难以被准确表征,使得监控视频识别变得更加棘手。在动态环境中识别物体、事故和行为仍然是视频监控面临的巨大挑战,需要通过强大而高效的算法进行物体检测、运动跟踪和分析以及其他细节的理解和识别。
环境变化丰富多样,因此需要一种具有普遍意义的在线算法,以在动态环境变化中实现有效的危险检测和预警。尽管已经开发了许多算法来应对不同环境下的视频识别挑战,但要全面理解环境对视频识别效率的影响,仍需要具有普遍意义的学习模型(忽略实际场景中的不可控差异)。这就是为什么即使是最新的算法,如用于高维、大规模异常检测的人群分割模型,仍然面临相当大的不确定性。
如何评估和计算周围环境变化影响中的调节注意力,以及如何定义环境变化对视频识别效率影响的预警级别,应该成为智能监控中实现精确安全的研究重点。虽然人