论文笔记《Spatio-Temporal Graph Structure Learning for Traffic Forecasting》

【论文】 Zhang Q, Chang J, Meng G, et al. Spatio-Temporal Graph Structure Learning for Traffic Forecasting[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2020, 34(01): 1177-1185.
【代码】 暂无

本篇文章主要是解决如何建模复杂、动态的空间依赖性问题,作者认为现在用的图卷积神经网络存在以下几个问题:

  • 使用预定义方法,或依赖于图结构的先验知识,这些并不能保证预测当前学习任务的准确性。
  • 多利用局部图结构,忽略了远距离关系。
  • 图结构一旦定义即固定,而实际上交通数据每时每刻都在变化,图结构也在变化。

因此,作者提出一种通用的图卷积公式Structure Learning Convolution (SLC),它能将结构信息显示地建模到卷积运算中。文章提出的SLCNN Layer部署了两个 SLC 分别用于捕捉全局和局部结构信息。同时,作者还将Pseudo three Dimensional convolution (P3D) networks 与 SLC 结合,用于捕捉时间依赖性。下面是对文章(模型)思路的梳理。

1. Structure Learning Convolution

1.1 Formulation of SLC

本节主要说明 Structure Learning Convolution(SLC) 基本思想,以及和普通卷积的异同点,这部分是本文模型的一个核心点,先记住构造思路就行,看上去还挺直观的。

作者认为卷积运算可看作是对输入信号的聚合操作,对于图结构数据,聚合操作不仅仅要聚合信号值,还要聚合图结构信息。因此,作者提出 SLC 表示为: y i = f ( ∑ e i j ∈ E S i j w j x j ) y_{i}=f\left(\sum_{e_{i j} \in \mathcal{E}} S_{i j} w_{j} x_{j}\right) yi=f(eijESijwjxj),其中:

  • f ( ⋅ ) f(·) f() 是激活函数;
  • y i y_i yi 是节点 i i i 的输出信号;
  • x i x_i xi 是节点 i i i 的输入数据,注意是embedded在图上的数据;
  • e i j ∈ E e_{i j} \in \mathcal{E} eijE 表示 i / j i/j i/j 之间有边,其中 E \mathcal{E} E不是预定义的,是在训练中得到的。
  • W \mathbf{W} W n n n 维卷积核权重, w j w_j w
### MATLAB 实现时空图卷积网络用于交通流量预测 为了实现《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting》中的方法,需要构建一个能够处理时空数据的框架。该框架主要由以下几个部分组成: #### 1. 数据预处理 在开始之前,需准备并清理交通流量数据集。这通常涉及缺失值填充、标准化以及创建邻接矩阵。 ```matlab % 假设 data 是 N x T 的矩阵, 其中 N 表示节点数, T 表示时间步长. data = load('traffic_data.mat'); % 加载交通流量数据 adj_matrix = create_adjacency_matrix(data); % 创建邻接矩阵函数 normalized_data = normalize_traffic_data(data); % 归一化交通流量数据 ``` #### 2. 构建图结构 通过定义道路之间的连接关系来建立图结构。这里使用邻接矩阵表示图的关系。 ```matlab function adj_matrix = create_adjacency_matrix(road_network) % road_network 应包含路段间距离或其他衡量标准的信息 distances = calculate_distances_between_roads(road_network); threshold = determine_threshold(distances); % 设定阈值 [N, ~] = size(distances); adj_matrix = zeros(N); for i = 1:N for j = 1:N if distances(i,j) <= threshold && i ~= j adj_matrix(i,j) = exp(-distances(i,j)^2 / (2*threshold^2)); end end end end ``` #### 3. 定义 ST-GCN 层 ST-GCN 结合了空间上的 GCN 和时间维度上的 CNN 来捕捉复杂的时空模式[^3]. ```matlab classdef STGCNLayer < nnet.layer.Layer properties K; % 支持的最大阶数 F_in; F_out; W; b; end methods function layer = STGCNLayer(K,F_in,F_out) layer.K = K; layer.F_in = F_in; layer.F_out = F_out; szW = [F_out,K+1,F_in]; layer.W = randn(szW)*0.01; layer.b = zeros(F_out,1); end function Z = predict(layer,X,A_hat) % X: 输入特征向量 (B,N,T,F_in), B 批次大小, N 节点数量, T 时间长度, F_in 特征维数 % A_hat: 预处理后的拉普拉斯矩阵 B = size(X,1); N = size(A_hat,1); T = size(X,3); H = cell(T,1); for t=1:T Xt = reshape(X(:,:,t,:),[],size(X,4)); % 将三维张量转换成二维矩阵 HT = []; for k=0:min(layer.K,size(A_hat,1)-1) AkX = power(A_hat,k)*Xt; HT = cat(2,HT,AkX); end H{t} = tanh(reshape(linear_combination(HT,layer.W)+repmat(layer.b',size(B*N,1),1),... [B,N,layer.F_out])); end Z = cat(3,H{:}); end function dLdW = backward(layer,dLdZ,X,A_hat) ... end end end ``` #### 4. 训练模型 设置超参数,并利用反向传播算法调整权重以最小化损失函数。 ```matlab num_epochs = 50; batch_size = 64; layers = [ imageInputLayer([input_height input_width channels]) convolution2dLayer(filterSize,numFilters,'Padding','same') batchNormalizationLayer() reluLayer() fullyConnectedLayer(outputSize) regressionLayer()]; options = trainingOptions('adam',... 'MaxEpochs', num_epochs,... 'MiniBatchSize', batch_size,... 'InitialLearnRate', 0.001,... 'Shuffle', 'every-epoch',... 'Verbose', false,... 'Plots', 'training-progress'); model = trainNetwork(trainingData,layers,options); ``` 请注意上述代码片段仅为概念验证性质,在实际应用时还需要考虑更多细节优化及调试工作。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值