本篇文章提出了一个轨迹回复的seq2seq模型,用于恢复轨迹中的细粒度点,并以端到端的方式在道路网络上进行地图匹配。
Introduction
轨迹的采样率对基于轨迹的各种应用有着重要的作用,然而由于能耗的影响,有着大量的低采样率的轨迹,为了有效的利用这些轨迹,我们需要回复这些轨迹,恢复之后还需要与路网完成匹配。
传统的方法是基于两级流水线的。神经网络的兴起为我们提供一个端到端的方法提供了机会。主要的挑战如下,(1)地图限制。(2)粗糙网格表示。(3)多样复杂的因素。
本文的贡献如下:(1)尝试通过Seq2Seq多任务学习来解决地图约束的轨迹恢复问题。(2)提出了一个的MTrajRec模型。利用约束掩码、注意机制和属性模块来提高性能。(3)使用真实世界的出租车轨迹数据集进行了大量实验。
Obview
本文工作的主要任务是给定一个低采样率的轨迹τ={p1,p2,p3...pn}\tau=\{p_1,p_2,p_3...p_n\}τ={p1,p2,p3...pn},推断其缺失点,得到ϵ\epsilonϵ采样的轨迹τ~={a1,a2,a3...an}\tilde{\tau}=\{a_1,a_2,a_3...a_n\}τ~={a1,a2,a3...an},并将其映射到道路网上。
METHODOLOGY
多任务Seq2Seq结构
Encoder
MTrajRec由编码器和解码器组成。编码器学习低采样率轨迹的顺序相关性,而解码器迭代地预测路段ID e和移动比率r,使用先前的输出作为输入向量。
首先将原始轨迹τ\tauτ转换为离散表示τ′\tau 'τ′。作者使用GRU作为编码器来获得低采样率轨迹的上下文向量,进而被当做解码器的初始状态。在每个时间步,编码器的隐藏状态sis_isi为,
简化为,
si=GRU(si−1,gi−1)s_i=GRU(s_{i-1},g_{i-1})
si=GRU(si−1,gi−1)
Decoder
作者建议decoder预测路段ID e和移动比率r,而不是直接预测坐标,以确保预测的位置必须限制在道路网络上。
作者同样使用GRU来作为解码器,解码器的隐藏单元可表示为,
上述结构可以保证恢复轨迹对路网的约束。然而,不准确的离散单元和各种复杂因素的挑战影响了轨迹恢复的有效性。
然后作者介绍三个组件来提高性能:约束屏蔽层、注意机制和属性模块。整体结构如图所示。
约束屏蔽层
将全球定位系统坐标映射到网格单元会使精确的信息丢失,给细粒度的MM轨迹恢复带来困难。为了应对这一挑战,作者设计了一个约束掩模层。
首先,作者定义了一个距离权重函数,它代表距离di,ld_{i,l}di,l对原始点pip_ipi的影响,在本文中作者采用的是指数函数的形式。在实践中,我们只考虑匹配距离路段不远的蓝色点。约束掩蔽层的定义如下,
使用约束蒙版层,低采样率轨迹中的点将被投影到有限的路段上,而不是整个路段空间上。
注意力机制
注意机制的目标是计算查询向量(即解码器中的当前隐藏状态)和关键向量(即编码器的输出)之间的相似性,以生成上下文向量a。因此,解码器被更新到隐藏状态hjh_jhj,
hj=GRU(hj−1,ej−1,rj−1,aj)h_j=GRU(h_{j-1},e_{j-1},r_{j-1},a_j)hj=GRU(hj−1,ej−1,rj−1,aj)
其中,sjs_jsj是编码器的输出。
属性模块
属性模块包括两种类型的因素,
(1)环境上下文特征fef_efe。将fef_efe与编码器的输出sns_nsn作为解码器的输入。环境背景特征不会随着轨迹的移动而显著改变。因此,作者将嵌入向量与编码器的上下文向量相结合,并在解码器的开头输入它们。
(2)空间上下文特征fsf_sfs。与稳定的环境背景特征不同,空间背景特征,如兴趣点和道路网络,随着车辆的移动而快速变化。因此,我们分别在编码器和解码器中为每个时间步长输入这样的特征。我们使用不同类别的POIs密度作为POIs特征,提取道路网络的属性作为道路网络特征,即路口数量和路段级别。然后,编码器的隐藏状态sjs_jsj和解码器的隐藏状态hjh_jhj可更新为,
模型训练
对于预测路段ID,损失函数为,
其中,τ\tauτ是低采样率轨迹,τ~\tilde{\tau}τ~是目标轨迹,L是路段的规模,aj.ea_j.eaj.e是路段ID的真实值,a~j\tilde{a}_ja~j是预测值。
其中,移动比率预测的损失函数为,
最终的模型优化函数与这两个损失函数相结合进行加权,并表示为:
λ\lambdaλ是一个可调参数,可以线性平衡我们工作中两个任务之间的权衡。
在训练过程中,我们应用梯度下降法更新参数。首先,提取包括外部因素特征和空间背景特征的属性。然后,我们选择一对轨迹τ\tauτ和τ~\tilde{\tau}τ~,使用等式11更新MTrajRec参数。
实验
实验设置
数据集
数据集为公交车轨迹数据集,使用来自OpenstreetMap的路网。从高采样速率轨迹中随机采样点来生成低采样速率轨迹。
评估指标
采用路段恢复的准确性和位置推断的距离误差来显示模型和基线方法的性能如下:
(1)MAE&RMSE:采用两种距离测量来评估位置恢复性能。 MAE是平均绝对误差,RMSE是地面真实值和预测值之间的均方根误差。
rndisrn_disrndis是预测和地面真实之间最短路径的距离。我们使用最小距离作为最终误差。
(2)召回率和精度。较大值表明,该方法可以更准确地预测路段。
baseline模型
目前还没有一种解决方案可以将低采样率轨迹恢复为高采样率轨迹,并同时将匹配映射到道路网络上。因此,作者设计了以下两阶段管道进行比较:
(1)Linear+HMM。
(2) DHTR + HMM。带有卡尔曼滤波器的子集2seq模型来恢复自由空间中的轨迹,这是轨迹恢复领域的最新方法。
(3) DeepMove [7] + Rule。我们通过连续预测每个缺失的路段,然后使用中心位置作为最终预测,使其适应这一任务。
MTrajRec的变体
(1)MTrajRec-noCons:去除了多任务模块中的约束屏蔽层。
(2)MTrajRec-noAttn:移除注意机制来检测注意机制的重要性。
(3) MTrajRec-noAtts:从模型中移除属性模块,以揭示这个组件的重要性。
结果
约束屏蔽的重要性
约束掩模引入了现有点的先验知识,这通过利用网格单元增强了丢失的信息。
注意机制的重要性
一个可能的原因是注意机制可以有效地加强对缺失位置的空间约束。
属性模块的重要性
可能是因为前面两个在模型中提供了足够的约束。
参数调整
单元长度
定性分析
MTtrajRec与DHTR+HMM和DeepMove+Rule的轨迹恢复与匹配的可视化比较
相关工作
结论
在本文中,我们提出了一种新的端到端深度学习模型MTrajRec,用于将低采样率轨迹恢复为高采样率地图匹配轨迹。我们将多任务学习引入Seq2Seq模型,以确保生成的轨迹与道路网络地图匹配。实现了约束屏蔽、注意机制和属性模块来提高性能。