视觉 - 大脑假说:理论、机制与应用探索
1. 研究背景
当前,视频行为识别面临诸多挑战。对视频行为的理解和表述通常依赖于目标跟踪及后续的运动分析,但由于被跟踪目标质心的意外移动,会导致外观变化和漂移问题,如姿态变化、光照变化、遮挡和运动模糊等,进而给行为理解和表述带来不确定性。因此,寻找更有效的视频行为识别算法十分必要。
目标跟踪算法可分为生成式跟踪和判别式跟踪:
| 跟踪算法类型 | 特点 | 缺点 |
| ---- | ---- | ---- |
| 生成式跟踪 | 不使用背景信息,学习子空间模型表示目标,通过该模型搜索重建误差最小的图像区域 | 需要足够的采样数据,外观模型需适应可能未对齐的示例,鲁棒性和效率可能因漂移问题降低 |
| 判别式跟踪 | 将实时目标跟踪任务视为二元分类任务,学习和选择最具判别性的特征进行高效跟踪 | 分类器用可能未对齐的示例不恰当更新时易产生漂移问题,且存在噪声示例 |
为避免对后续行为识别产生进一步影响,一些有效且高效的视频目标跟踪算法应运而生。其中,压缩跟踪研究表明,基于压缩域提取的特征可以很好地表示目标,近年来受到了广泛关注和应用。
2. 注意力机制
2.1 有人驾驶与无人驾驶系统的注意力机制差异
有人驾驶系统主要依靠个体智能,其注意力会受经验和个人兴趣选择的影响,危险预警级别越高,危险预知难度越大。
无人驾驶系统的注意力机制则大不相同,它表现为无人机、无人车或无人船等与监控系统、微芯片、卫星和通信站的群体协作。整个安全系统可视为一个微型社会,计算智能提高了无人驾驶系统的预警性能。