Online Multi-Target Tracking Using Recurrent Neural Networks
第一个端到端在线目标追踪学习方法;
多目标跟踪挑战
- 目标没有先验知识并且随时间变动;
- 对当前所有目标的持续状态估计;
- 数据关联的离散组合问题;
框架划分
RNNs为状态估计和更新、目标存在概率估计;
LSTM实现数据融合;
RNN可以很好地处理运动预测和状态更新,但是处理不好数据关联,所以加入LSTM。
整体流程图:
方法优点
- 有效地调试单个部分;
- 模快化结构,增加、删除某块很容易;
- 单独训练某一块,加快训练和收敛的速度;
状态预测和更新
基于贝叶斯滤波,分为两步:动态预测状态,然后基于测量值更新状态的可信度;针对目标跟踪问题中目标可能消失和出现,引入连续测量误差来决定track的开始和结束;
时态RNN的结构图:
要实现三个目标:
- Prediction:无测量值的情况下预测目标运动
- Update:基于目标-测量值的匹配纠正状态的分布
- Birth/Death:基于状态,测量和数据关联判断track是否开始或结束
预测状态只取决于hidden状态和当前状态;
当下一帧的匹配概率矩阵可用,状态即可根据这个矩阵进行更新,需要将预测值和测量值组成起来,并用概率矩阵进行加权;
同时计算下一帧中track的存在概率;
ε模拟目标存在的概率,论文中测试直接忽视ε小于0.6的目标;
损失函数(黄色为预测值,~为真实值)(最小化均方误差):
为了判断开始和结束的二元交叉熵损失函数:
使用二元交叉熵损失函数的缺点:缺少测量值的时候,每一帧的track结束;
解决:增加先验光滑度ε*;
LSTMs数据关联
框架图:
Ai 表示A的一行,每一次预测一个目标;
每一步都输入整个特征向量,新加入的特征直接扩充向量即可;
损失函数:
a~是正确的匹配;Aij是目标i对测量值j的匹配概率;
实验结果
性能没有达到顶,但是快了两个数量级;