多目标过滤与视频解纠缠表示的创新研究
多目标过滤算法概述
在多目标过滤领域,传统的固定运动和测量模型存在一定局限性。为解决这一问题,研究人员采用了自适应深度学习框架。具体做法是,使用随机有限集术语定义目标元组,并利用长短期记忆网络(LSTM)。LSTM网络在学习目标运动模型的同时,还能对杂波进行过滤。此外,还定义了一种新颖的数据关联算法,该算法与预测的小轨迹元组兼容,不仅可以更新被遮挡的目标,还能对目标的诞生、存活和死亡进行分配。最后,通过计算常用过滤场景下的最优子模式分配(OSPA)度量来评估该算法的性能。
视频分析需求与挑战
随着公共安全和交通控制需求的增加,监控摄像头的使用以及产生的视频数据量在过去几年中迅速增长。对大量无标签监控视频进行有效分析变得越来越重要。由于视频标签稀缺,且表示对于视频场景至关重要,无监督学习和弱监督学习成为理想的范式。近年来,深度生成模型,特别是生成对抗网络(GAN)的出现,在这方面取得了显著进展。
监控视频通常由固定安装的摄像头捕获,其内容包括静态部分(背景)和动态部分(移动物体或行人)。将视频中的因素解纠缠将极大地促进工业中的存储和分析。例如,静态部分可用于场景检测和动作识别,而动态表示可用于交通流量估计和视频预测。由于其低维度,这些表示甚至可用于视频检索。
相关工作回顾
在计算机视觉任务中,无监督学习和弱监督学习展现出巨大潜力。以下是几种常见模型及其应用:
- 自动编码器(Auto - Encoder) :是最流行的自监督结构,通过创建信息瓶颈来学习高效的数据编码。其具有不同正则化的变体、生成模型(变分自动编码器,VAE)和半监
超级会员免费看
订阅专栏 解锁全文
4394

被折叠的 条评论
为什么被折叠?



