基于图卷积神经网络的城市轨道交通流量预测

提出一种基于深度学习的STGCNNmetro模型,利用图卷积神经网络预测城市地铁网络的短期客流量,实验证明优于多种基线模型。


1、文章信息

《Predicting Station-Level Short-Term Passenger Flow in a Citywide Metro Network Using Spatiotemporal Graph Convolutional Neural Networks》。

2019年中国海洋大学的几位老师发在IISPRS International Journal of Geo-Information上的一篇文章(地学4区,IF:1.84)。

2、摘要

本文提出了一种基于深度学习的方法STGCNNmetro (spatial - temporal graph convolutional neural networks for metro),用于同时预测城市全网每个地铁站的进站流量和出站流量。具体地说,STGCNNmetro不再使用网格表示地铁站,而是将城市地铁网络转换成一张图,并使用图卷积神经网络(graph convolutional neural networks, GCNNs)进行预测。首先,我们应用立体图卷积运算来无缝地捕捉沿地铁网络的不规则时空依赖关系。其次,构造了一个由GCNNs组成的深层结构来捕捉城市层面上的时空依赖关系。最后,我们整合三个时间模式(最近的、每天的和每周的),并融合从这些模式中捕获的时空依赖关系,形成最终的预测值。STGCNNmetro模型是一个端到端框架,可以接受原始客流量数据,自动捕获全市地铁网络的有效特征,并输出预测。通过对中国上海城市轨道交通短期客流量的预测,验证了该模型。实验表明,STGCNNmetro模型优于7个已知的基线模型(LSVR、PCA‐kNN、NMF‐kNN、Bayesian、MLR、M‐CNN和LSTM)。此外,我们还探讨了模型对其参数的敏感性,并讨论了预测误差的分布。

3、简介

整个城市的地铁网络可以表示为一个图,其中地铁站为顶点,地铁线路为边。每个站点顶点都有一个由客流历史值组成的特征向量,可以定义一个邻接矩阵来编码站点之间的成对依赖关系。因此,地铁网络不需要用网格来表示地铁站,也不需要用CNN来捕捉特征,而是可以用一个通用的图形来描述,利用GCNN可以有效地捕捉地铁网络层面而不是网格层面上不规则的时空依赖关系。

4、理论介绍

(1)用图表示地铁网络客流量的时间序列

根据前面M次观测,我们可以预测后续时间步长的客流量,在这项工作中,我们在一个图表上定义了一个城市范围的地铁网络,并关注结构化的时间序列客流量。如图1所示,V,E,W分别代表顶点,边和加权邻接矩阵。其中顶点Vt 代表t时刻所有地铁车站的客流量向量。

640?wx_fmt=png

(2)图卷积操作

常规网格的标准卷积显然不适用于一般图。目前研究如何将CNNs推广到结构化数据形式的一种基本方法是利用图的傅里叶变换在频域中进行操作。其介绍了将卷积应用于光谱域的光谱框架,即通常所说的谱图卷积。一些后续研究通过将计算复杂度从O(n2)降低到线性成本,使得图卷积更加有效。本文使用的图卷积如下:

640?wx_fmt=png

图卷积算子 “*g”是谱图卷积的概念,表示图信号x与核函数Θ的乘积。K表示从中心节点确定卷积的最大半径,ɑ卷积核参数, L是归一化的图拉普拉斯算子,σ是激活函数(例如ReLU)。(搞明白这个公式推荐阅读Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering)

(3)利用立体图卷积来捕捉不规则的时空依赖关系

在构建了上一节所述的图结构地铁网络数据之后,我们使用GCNN提取了地铁网络的局部不规则时空依赖关系。以顶点i为例,图2给出了核大小为1的传统图卷积(K = 1)。实际上,这是用一阶邻接进行的卷积计算。显然,顶点i与其5个一阶相邻顶点之间的空间依赖关系捕获(在图2中标记为1、2、3、4和5)。该操作要对所有顶点执行。针对地铁网络客流量时间前M个时间段的序列数据,我们构造了一个立体卷积核来无缝提取时空相关性。M个历史流量图被叠加在时间维度上。在立体图卷积中,卷积在空间和时间维度上都是无缝执行的,如图3所示。定义了时空图卷积算子“*g’”为图信号x’与立体核函数Θ’的乘积。对于顶点i,立体图卷积之后,能够捕获其一阶空间邻接顶点及其M阶时间邻接中包含的不规则时空依赖关系。

640?wx_fmt=png

640?wx_fmt=png

(4)使用深度GCNNs捕捉全网层面遥远的时空依赖关系

在地铁网络结构中,高阶邻接可以通过低阶邻接累积。例如,二阶邻接可以通过积累两个一阶邻接来获得。通常,一个城市地铁网络的空间规模很大,从市中心到郊区有很多车站。从直观上看,相邻车站之间的客流量可能会相互影响。这可以由一个GCNN层有效地处理,该层显示了强大的分层捕获空间结构信息的能力。此外,由于地铁系统连接两个相距很远的位置,这导致了遥远的车站之间的时空依赖关系。由于一个卷积层只考虑位置相近的站之间的依赖关系,为了捕获距离较远的站之间的时空依赖关系,需要叠加多个GCNN层来形成一个深度GCNN结构。

640?wx_fmt=png

(5)利用时空GCNNs预测全市地铁车站短期客流量

640?wx_fmt=png

提出的基于深度学习新模型STGCNNmetro的总体框架如图5所示。显然,地铁系统的客流包括进出站。在本研究中,进站流量为给定时间间隔内进站的总客流量,出站流量为出站的总客流量。我们首先将历史上的全市地铁进站流量图和出站流量图在每个时间间隔上转换为结构化的时空时间序列。由于时空依赖具有不同的模式,历史流量时间序列分为近期、每日和每周模式。然后,构建了三个基于GCNNs的子模型来捕捉这三种模式的特征。在参数矩阵的基础上,对三种输出进行融合,对不同车站不同模式的分析结果赋予不同的权重。最后,选择ReLU函数激活融合结果,给出最终的预测值。

其他部分不做解释。

5、特别之处

文章画的图很漂亮,另外,文章的结果讨论特别详细。

Attention

公众号:AI蜗牛车

保持谦逊、保持自律、保持进步


640?wx_fmt=jpeg

### 城市轨道交通短时客流预测的研究综述 #### 自适应图卷积网络的应用 基于自适应图卷积网络(AGCN)的城市轨道交通短时客流预测模型被广泛应用于实际场景中。通过利用智能IC卡产生的大量交易记录,此模型能够有效捕捉站点间复杂的时空关联特性,实现对未来短时间内客流量的精准预估[^2]。 #### 时间序列分析技术 对于时间序列中的长短期依赖关系处理,LSTM(长短期记忆网络)作为一种特殊的递归神经网络结构表现出色。它不仅克服了传统RNN难以训练深层网络的问题,而且能很好地保留历史信息,在面对周期性强且存在突变情况下的客流数据时尤为适用。此外,GRU作为简化版的LSTM同样具备良好的性能表现,尤其适用于样本数量有限的情形下[^3]。 #### 综合性预测框架构建 为了提升整体预测准确性并增强系统的鲁棒性,通常会采用集成学习策略来融合不同类型的单体模型优势。例如随机森林(Random Forest),XGBoost等回归类算法擅长挖掘特征变量间的非线性映射规律;而ARIMA, SARIMAX这类经典统计学方法则善于描述平稳过程的发展趋势。两者相结合形成的混合模式可以在一定程度上弥补各自缺陷,达到更好的泛化能力。 ```python import pandas as pd from sklearn.ensemble import RandomForestRegressor from statsmodels.tsa.statespace.sarimax import SARIMAX # 构造随机森林模型实例 rf_model = RandomForestRegressor(n_estimators=100) # 训练SARIMAX模型 sarima_model = SARIMAX(endog=train_data['passenger_count'], order=(1, 1, 1), seasonal_order=(0, 1, 1, 7)) fitted_sarima = sarima_model.fit() def hybrid_predict(model_rf, model_sarima, X_test): pred_rf = model_rf.predict(X_test.drop('date', axis=1)) # 使用RF进行预测 forecast_sarima = model_sarima.forecast(steps=len(X_test)).values # 调用SARIMA未来值预测 final_prediction = (pred_rf + forecast_sarima)/2 # 平均两种模型的结果得到最终输出 return final_prediction ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值