
| 论文题目 | Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting |
|---|---|
| 论文链接 | https://arxiv.org/abs/1707.01926 |
| 源码地址 | https://github.com/liyaguang/DCRNN |
| 发表年份-会议/期刊 | 2018 ICLR |
| 关键词 | 交通预测,扩散卷积,递归神经网络,时空依赖,图神经网络 |
摘要
时空预测在神经科学、气候和交通领域有着广泛的应用。交通预测是此类学习任务的一个典型例子。
该任务的挑战在于:(1) 路网中复杂的空间依赖,(2) 道路状况变化带来的非线性时间动态,以及 (3) 长期预测的内在困难。
为了解决这些挑战,我们提出将交通流建模为有向图上的扩散过程,并引入扩散卷积递归神经网络 (DCRNN),这是一种用于交通预测的深度学习框架,结合了交通流中的空间和时间依赖性。具体来说,DCRNN 通过图上的双向随机游走捕捉空间依赖,并使用带有调度采样的编码器-解码器架构来捕捉时间依赖性。
我们在两个真实世界的大规模路网交通数据集上评估了该框架,并观察到其相较于最新基准模型有 12% - 15% 的一致性提升。
DCRNN
1 引言
时空预测对于在动态环境中运行的学习系统至关重要。它在自动驾驶车辆操作、能源和智能电网优化、物流和供应链管理等领域有着广泛的应用。在本文中,我们研究了一个重要任务:基于路网的交通预测,这是智能交通系统的核心组成部分。交通预测的目标是根据传感器网络的历史交通速度和基础路网,预测未来的交通速度。
该任务的主要挑战在于复杂的时空依赖关系以及长期预测的内在困难。一方面,交通时间序列表现出强烈的时间动态。反复出现的事件如高峰时段或事故会导致非平稳性,从而使长期预测变得困难。另一方面,路网中的传感器包含复杂而独特的空间关联。图1举例说明了这一点。道路1和道路2是相关的,而道路1和道路3则不相关。虽然道路1和道路3在欧几里得空间中距离较近,但它们表现出的行为却截然不同。此外,未来的交通速度更多地受到下游交通的影响,而非上游交通。这意味着交通中的空间结构是非欧几里得且有方向性的。

图1:空间相关性主要由路网结构主导。(1) 道路1的交通速度与道路2相似,因为它们位于同一条高速公路。(2) 道路1和道路3位于高速公路的相反方向。尽管在欧几里得空间中彼此接近,但它们的路网距离很大,交通速度差异显著。
交通预测已经被研究了几十年,主要分为两大类:基于知识的方法和基于数据的方法。在交通运输和运筹学中,基于知识的方法通常应用排队论并模拟用户的交通行为。在时间序列领域,基于数据的方法如自回归积分滑动平均模型(ARIMA)和卡尔曼滤波仍然很流行。然而,简单的时间序列模型通常依赖于平稳性假设,而交通数据往往违背这一假设。近年来,交通预测的深度学习模型不断发展,但没有考虑空间结构。
在这项工作中,我们表示了使用有向图的交通传感器之间的配对空间相关性,图中的节点是传感器,边的权重表示由路网距离测量的传感器对之间的接近度。我们将交通流的动态建模为扩散过程,并提出了扩散卷积操作来捕捉空间依赖性。我们进一步提出了扩散卷积递归神经网络(DCRNN),它整合了扩散卷积、序列到序列架构和调度采样技术。在对真实世界的大规模交通数据集进行评估时,DCRNN始终在交通预测的基准测试中大幅优于最新的基准方法。总结如下:
-
我们研究了交通预测问题,并将交通的空间依赖性建模为有向图上的扩散过程。我们提出了扩散卷积,它具有直观的解释性,且能够高效计算。
-
我们提出了扩散卷积递归神经网络(DCRNN),这是一种整体方法,通过使用扩散卷积和序列到序列学习框架以及调度采样,捕捉时间序列中的空间和时间依赖性。DCRNN不仅限于交通领域,还可以广泛应用于其他时空预测任务。
-
我们在两个大规模的真实世界数据集上进行了广泛的实验,提出的方法在基准测试中相比最新的基准方法获得了显著的提升。
2 方法
我们将时空交通预测的学习问题形式化,并描述如何使用扩散卷积递归神经网络来建模依赖结构。
2.1 交通预测问题
交通预测的目标是根据先前观察到的来自路网上 N N N 个相关传感器的交通流,预测未来的交通速度。我们可以将传感器网络表示为一个加权有向图 G = ( V , E , W ) G = (\mathcal{V}, \mathcal{E}, \mathbf{W}) G=(V,E,W),其中 V \mathcal{V} V 是节点的集合, ∣ V ∣ = N |\mathcal{V}| = N ∣V∣=N, E \mathcal{E} E 是边的集合, W ∈ R N × N \mathbf{W} \in \mathbb{R}^{N \times N} W∈RN×N 是加权邻接矩阵,表示节点之间的接近度(例如,基于它们的路网距离的函数)。将观察到的交通流表示为图信号 X ∈ R N × P \mathbf{X} \in \mathbb{R}^{N \times P} X∈RN×P,其中 P P P 是每个节点的特征数量(例如,速度、流量)。设 X ( t ) \mathbf{X}^{(t)} X(t) 表示在时刻 t t t 观察到的图信号,交通预测问题的目标是学习一个函数 h ( ⋅ ) h(\cdot) h(⋅),将历史图信号 T ′ T' T′ 映射到未来的 T T T 个图信号,给定一个图 G G G:
[ X ( t − T ′ + 1 ) , ⋯ , X ( t ) ; G ] → h ( ⋅ ) [ X ( t + 1 ) , ⋯ , X ( t + T ) ] [\mathbf{X}^{(t-T'+1)}, \cdots, \mathbf{X}^{(t)}; G] \xrightarrow{h(\cdot)} [\mathbf{X}^{(t+1)}, \cdots, \mathbf{X}^{(t+T)}] [X(t−T′+1),⋯,X(t);G]h(⋅)[X(t+1),⋯,X(t+T)]
2.2 空间依赖建模
我们通过将交通流与扩散过程相关联来建模空间依赖性,该过程明确捕捉了交通动态的随机性。此扩散过程由有向图 G G G 上的随机游走表征,重启概率为 α ∈ [ 0 , 1 ] \alpha \in [0, 1] α∈[0,1],状态转移矩阵为 D O − 1 W D_O^{-1} \mathbf{W} DO−1W。其中 D O = diag ( W 1 ) D_O = \text{diag}(\mathbf{W} \mathbf{1}) DO=diag(W1) 是出度对角矩阵, 1 ∈ R N \mathbf{1} \in \mathbb{R}^N 1∈RN 表示全 1 向量。经过多次迭代后,此马尔可夫过程收敛到一个稳态分布 P ∈ R N × N \mathbf{P} \in \mathbb{R}^{N \times N} P∈RN×N,其第 i i i 行 P i , : \mathbf{P}_{i,:} Pi,: 表示从节点 v i ∈ V v_i \in \mathcal{V} vi∈V 的扩散可能性,因此表示相对于节点 v i v_i vi 的接近度。以下引理提供了稳态分布的闭式解。
引理 2.1 (Teng et al., 2016)扩散过程的稳态分布可以表示为图上的无限随机游走的加权组合,其形式为:
P = ∑ k = 0 ∞ α ( 1 − α ) k ( D O − 1 W ) k \mathbf{P} = \sum_{k=0}^{\infty} \alpha(1-\alpha)^k (D_O^{-1} \mathbf{W})^k P=k=

最低0.47元/天 解锁文章
423

被折叠的 条评论
为什么被折叠?



