迈向鲁棒的在线视觉跟踪与异常事件检测
1. 在线视觉跟踪的挑战与解决方案
在视觉跟踪领域,实现对进出相机视野的物体进行可靠的检测和识别是一项关键任务。一种简单的方法是设置检测器置信度的阈值,但为了让机器能够模仿人类水平的视觉认知,还需要研究更复杂的算法。
1.1 铰接物体跟踪的难题与应对
铰接物体的跟踪对于运动分析至关重要。当我们能够使用在线算法稳健地跟踪单个物体后,如何将这些方法扩展到铰接物体成为了新的问题。在应用贝叶斯跟踪方法跟踪3D人体姿势时,主要困难在于状态向量的高维度,通常为20 - 60维。不过,姿势参数通常位于嵌入在高维空间中的低维流形上。
为了解决这个问题,我们提出了用全局协调的因子分析器混合模型(GCMFA)来近似低维流形,从而降低状态向量的维度,实现高效有效的贝叶斯跟踪。该模型从运动捕捉数据中学习得到,能提供低维流形的全局参数化。混合中的每个因子分析器是一个“局部线性降维器”,近似流形的一部分。通过在全局坐标系中对齐这些局部线性部分,可获得流形的全局参数化。
GCMFA模型的参数从运动捕捉序列中学习,它在降维过程中能有效保留重要信息,捕捉关键运动学信息。局部线性因子分析器的全局协调确保了姿势在潜在空间中有全局一致的参数化,同时保留了流形的连续性。高维姿势数据的密度通过低维空间中的分段线性高斯因子分析器近似,通过使因子分析器的内部坐标一致,可获得用于降维的单一、连贯的低维坐标系。线性因子的混合和协调提供了低维(潜在)空间和姿势空间之间的非线性双向映射,学习算法高效且能处理大型训练数据集。
学习完GCMFA模型后,我们将其应用于具有降维状态空间的多假设跟踪器中进行3D人体跟踪。目前正在HumanEva
超级会员免费看
订阅专栏 解锁全文
178

被折叠的 条评论
为什么被折叠?



