文章信息:
题目:Exploiting dynamic spatio-temporal correlations for citywide traffic flow prediction using attention based neural networks
期刊:Information Sciences 时间:2021 影响因子:8.233
问题描述
- 描述不同区域之间的复杂空间关系
- 不同时间段之间的动态时间关系
提出方法
- AttDHSTNet模型,时间轴分为三个部分:(i)紧密程度;(ii)期间;和(iii)每周依赖。
- 卷积神经网络捕获空间依赖性,并使用LSTM模型沿着注意力机制来捕获每个部分的时间依赖性(基于历史数据,天气和事件)
- 将从外部辅助信息收集的外部分支与这三个部分的融合结果进行整合。
引言
背景:预测未来的交通流量,并与区域的人群容量进行比较,则可以避免这种灾难(上海踩踏事件),并且可以及时提醒市民。
未来交通流人群类型:流入、流出
每个区域的流入,流出相互影响:影响因素
- 空间依赖性:R2区的流入受远区和近区流出的影响。R2的出流也会影响近区的入流。R2的入流也可能影响其自身区域的出流 。
- 时间依赖性:连续时间内变化缓慢,周期性变化
- 外部因素:天气情况、季节、道路工程
城市被划分成基于经纬度的网格地图
以往研究不足:
- ST-RESNET的卷积神经网络(CNN)方法:基于残差网络提取相邻区域的影响;人工对时态依赖进行分类,难以很好地组织时态关联。
时空特征融合方法:
本文提出了一种关注机制,在不同的时间对每个交通流序列自动分配不同程度的重要性,以提高预测性能和准确性 。
- 基于数据集中的最新信息来预测人群流量,并产生最佳结果
创新点:动态的深度混合时空网络(DHSTNET),同时预测流入和流出
- DHSTNET体系结构:考虑时空相关性和外部因素。将城市交通人群的时间特征分为:时间接近性、周期和每周。合并具有外部属性的三个分量,为不同的区域和分支分配不同的权重。
- 动态地获取了人群的时空流动特征
- 引入了一种注意力机制ATT-DHSTNET:时间注意来捕捉不同时间步长之间的动态时间方面,利用空间注意来突出不同位置之间的空间关联
问题定义
1. 城市区域:按照经度和纬度将整个城市划分为(I x J)网格
2.人群流入/流出
先前DHSTNet模型:预测全市交通人群流动
ATT-DHSTNET模型的体系结构:(a)历史数据的时间贴近度,(b)周期影响,(c)周影响,(d)历史数据的外部影响。
实现过程:
- 城市以(I*J)网格地图的形式被划分为不同的区域。
- 人群流可以在给定时间t被改变为作为2通道图像状矩阵的流入和流出。
- 将时间轴分为三个不同的部分,以说明:(a)遥远的历史时间;(B)最近的历史时间(c)当前时间
- CNN捕获远程区域中的所有空间依赖关系,LSTM捕获每一种时序数据的时序关系;引入基于convlstm的注意力模块
- 从外部数据集中手工提取某些特征
- 融合所有三个分支的结果——称为XFusion,基于不同位置的矩阵参数,同时为不同分支的输出分配不同的权重
- XFusion还与作为外部组件结果的Xext合并
- 结合外部输出,以及所有的时空特征
实验:
数据集:(BikeNYC)、(TaxiBJ)的全市交通流量的流入和流出
结果:
不使用注意力机制(a)RMSE度量和(b)MAPE度量的BikeNYC/TaxiBJ数据集的预测结果
使用注意机制(a)RMSE度量和(b)MAPE度量的BikeNYC/TaxiBJ数据集的预测结果。
不含注意力模块的四个组成部分的影响
- DHSTNet-C:该方法仅捕获紧密度分支的空间和时间依赖性。
- DHSTNet-CD:该方法由时间紧密和周期分量组成。
- DHSTNet-CDR:方法包括所有的时间属性,包括接近度,周期和每周。
使用RMSE度量中的变化的模型深度的影响
TaxiBJ和BikeNYC数据集的结果(基于有无外部数据)
TaxiBJ和BikeNYC数据集的结果(基于有无外部数据)
时间复杂度、训练时间对比