多目标跟踪的鲁棒环境感知技术解析
1. 跟踪感知的实现
1.1 数据集
在多目标跟踪的实际场景中,采用了两个知名数据集:MOT16 和 MOT17。
- MOT16 :包含 14 个行人视频序列,录制条件多样,如分辨率、帧率、光照、人群密度和拍摄视角等。这些序列被公平地划分为训练集和测试集,训练集有 4 个由移动相机捕获的序列,测试集有 3 个由固定相机拍摄的序列。数据集中的公开检测结果由可变形部件模型(DPM)检测器生成。
- MOT17 :视频序列与 MOT16 类似,但引入了通过 Faster R - CNN、DPM 和 SDP 生成的三个不同的公开检测集,使序列总数达到 42 个。为获得全面评估结果,对所有 21 个测试序列的跟踪器性能进行平均。使用私有检测进行跟踪时,MOT16 和 MOT17 数据集没有区别。
1.2 参数估计
由于缺乏合适的预训练数据集,专门生成了一个数据集来训练 CRF 模块。将 MOT16 和 MOT17 数据集分为两部分,40% 的视频帧用于创建训练集,其余用于验证。
- 训练集生成 :使用原始的 Tracktor++ 在初始部分生成训练集,识别因小轨迹未充分停用而产生的跟踪错误,包含此类错误的帧被指定为负样本,正样本则随机选择三倍数量的实例。
- 参数调整 :使用随机梯度下降(SGD)算法微调一元和二元项的权重,学习率设为 (1\times10^{-2}),训练 30 个周期。但直接使用学习值在验证集上效果不佳,原因一是 Tr
超级会员免费看
订阅专栏 解锁全文
2100

被折叠的 条评论
为什么被折叠?



