基于时空关注的多尺度卷积网络交通预测(MSCN)

本文的主要贡献如下:

(1)设计了一种新颖的端到端交通预测框架,该框架利用注意力机制对时空相关性进行建模。此外,还提出了一种软阈值融合方法来调整空间和时间相关性的流动。

(2)提出了一种多尺度卷积网络,用于捕获不同分辨率的复杂时空特征,提高预测性能。

(3)我们在两个公开的数据集上进行了大量的实验,以验证我们提出的模型在交通预测任务方面的效率。实验结果表明,与现有的基线相比,我们的模型具有更好的预测性能

时空位置嵌入

首先,利用两个全连接神经网络提取输入向量的特征;然后,利用先验位置嵌入实现时空嵌入。

然后,在编码器中,一个空间注意和一个时间注意共同编码空间和时间相关性。在编码器之后,变压器注意层用于对历史时间和未来时间之间的时间相关性进行建模。最后,在解码器中,一个卷积层、一个卷积池化层和一个扩展卷积层共同提取复杂的时空特征。

设计了一个时空位置嵌入层来学习嵌入到节点中的特征, 空间嵌入和 和时间嵌入,用邻接矩阵A初始化,用单热编码初始化,H个时间步长内N个节点的嵌入特征表示为,Ft为全连接层,用于将特征转化为d维向量,是未来P个时间步长内N个节点的嵌入特征,然后将他们分别输入编码器和解码器。

具有时空注意的解码器

提出了一个基于注意力的编码器。编码器由空间注意、时间注意和软阈值融合三个子组件组成

空间注意:

        类似GMAN,为隐藏状态,

表示节点v对节点vi在第k个头部的归一化分数,权重和为1,fx为非线性变换W和b为可学习参数,空间注意力输出用表示。

时间注意:

为节点vi在时间步长tj的隐藏状态,表示归一化时间步长tq在第k个头注意处对时间步长tj的得分。

软阈值融合:

        受门控融合和软阈值机制的启发,设计了一种自动关注重要特征而忽略无用特征的软阈值融合。考虑到空间注意和时间注意HS和HT的输出,首先利用全局平均池化(GAP)和全局最大池化(GMP)来最小化过拟合概率。然后将结果送入两个完全连接的层。最后得到空间阈值τS和时间阈值τT,分别表示为

 其中δ为激活函数。表示元素点积。Ws和Wt是可学习的参数。θa、θm分别为GAP操作和GMP操作。以计算空间注意力的软阈值为例,我们有

 

 因此,HS和HT融合为:

 其中,zS和zT是软阈值,反映了空间和时间相关性的影响程度。软阈值融合机制确保了有用的空间和时间特征得到更多的关注,同时去除了不有用的特征。

 时间步长与注意力转换的相关性

        为了对历史时间步长和未来时间步长之间的相关性进行建模,我们在中使用转换注意力来构建未来表示,然后将其馈送到解码器中。

 其中为节点vi在未来时间步长ty对应的时间相关隐藏状态,为注意力得分,它有助于动态调整编码后的流量特征H。然后将转换注意力的输出H'送入到解码器。

 卷积神经网络解码器

         该解码器由三个卷积层组成:卷积层、卷积池化层和扩展卷积层。针对短期和长期的交通预测,三个卷积层同时处理短序列和超长序列,并发现各种范围的相关性。将这些卷积层的输出连接起来生成最终结果。

Convolution Group:

         观察到一个卷积层只能捕获紧密依赖关系,而一堆卷积层可以捕获任何区域[21]的依赖关系。在卷积群中,我们将Lc卷积叠加如下,其中为卷积层的第i个核参数,为卷积运算。Qc0 = H'为输入,HC = QcLc为输出。为方便起见,过滤器尺寸为3 × 3。

Conv-Pooling Group:

        池化操作对于成功的对流网络至关重要。此外,最大池化操作使广泛的接受域能够提取多尺度流量特征。该模块使用并行结构。一个1 × 1的卷积层,然后是一个最大池化层来计算约简。然后用连续的Lp堆叠3 × 3卷积层提取多尺度特征。卷积化的设计如图所示

Dilated-Conv Group.:

         为了处理长期预测任务,我们应用多尺寸的扩展卷积来处理非常长的序列。研究表明,扩展卷积在处理较长的序列时具有较低的模型复杂度。选择合适的核大小来处理短期和长期预测是一个具有挑战性的问题。1 × 1、3 × 3和5 × 5滤波器尺寸已广泛应用于初始模块,并取得了良好的性能[14]。我们使用3 × 3展开卷积和5 × 5展开卷积的组合来设计模块。单元数为Ld

给定输入H',输出HC、HP、HD三组,则解码器的最终结果为

其中WC、WP、WD为可学习参数,反映三组的影响程度.

 损失函数

        损失函数的目标是使预测误差最小化。我们使用平均绝对误差(MAE)作为预测值与基本事实之间的损失函数:

 实验结果

不同交通预测方法的性能比较。

 PeMS-BAY 和 METR-LA的消融分析

 不同融合方法在METR-LA数据集上的性能比较。

 结论

        本文提出了一种新的时空深度学习网络——多尺度卷积网络(Multi-Scale Convolutional Networks, MSCN)来解决交通流预测问题。MSCN遵循编码器-解码器架构。具体来说,它首先采用了一个图注意网络来精确地模拟时空特征。然后,采用软阈值融合对时空相关流进行调整。最后,推导卷积模块来解码时空序列表示。我们的实验结果表明,MSCN优于最先进的基线。交通状况受许多因素的影响。在未来的工作中,我们将考虑天气、POI等外部因素的影响,进一步提高预测精度。

### 多尺度运动表现回归模型概述 多尺度运动表现回归模型旨在通过不同尺度的时间窗口来捕捉和预测人体运动中的复杂动态特性。这类模型通常结合了多种机器学习技术和信号处理方法,能够有效应对动作捕捉、视频分析等领域的需求。 #### 技术原理 为了更好地理解多尺度运动表现回归模型的工作机制,可以将其分解为以下几个核心组件: - **多尺度特征提取**:利用不同的时间窗长度对原始序列数据进行分段处理,从而获得多个层次上的特征表示。这有助于捕获短时局部变化以及长时间趋势信息[^1]。 - **自回归建模**:借鉴视觉自回归建模(Visual Autoregressive Modeling, VAR)的思想,通过对历史帧之间的依赖关系建模,实现对未来状态的有效预测。这种方法特别适用于连续性的生物力学过程模拟。 - **深度神经网络集成**:采用卷积神经网络(CNN)、循环神经网络(RNN)及其变体如LSTM/GRU等先进架构作为基础框架,增强系统的表达能力和泛化能力。特别是对于复杂的时空关联性挖掘非常有利[^3]。 #### 实现方法 以下是构建一个多尺度运动表现回归模型的具体步骤说明: ```python import torch from torch import nn import numpy as np class MultiScaleMotionRegression(nn.Module): def __init__(self, input_dim=784, hidden_dims=[512, 256], output_dim=10): super(MultiScaleMotionRegression, self).__init__() # 定义多层感知机部分 layers = [] dims = [input_dim] + hidden_dims for i in range(1, len(dims)): layers.append(nn.Linear(dims[i - 1], dims[i])) layers.append(nn.ReLU()) self.mlp = nn.Sequential(*layers) self.fc_out = nn.Linear(hidden_dims[-1], output_dim) # 添加 CNN 层用于空间特征抽取 self.cnn_layers = nn.Sequential( nn.Conv1d(in_channels=input_dim//hidden_dims[0], out_channels=hidden_dims[0]*2, kernel_size=3), nn.MaxPool1d(kernel_size=2), nn.Flatten() ) def forward(self, x): batch_size, seq_len, _ = x.shape # 对输入序列应用不同大小的时间窗口采样 scales = [ F.avg_pool1d(x.permute(0, 2, 1), scale).permute(0, 2, 1) for scale in [seq_len // (i+1) for i in range(len(seq_len)//2)] ] features = sum([self.cnn_layers(scale_i.unsqueeze(-1)) for scale_i in scales]) hiddens = self.mlp(features.view(batch_size,-1)) outputs = self.fc_out(hiddens) return outputs # 创建实例并测试前向传播 model = MultiScaleMotionRegression(input_dim=96*2, hidden_dims=[128, 64], output_dim=1) test_input = torch.randn((32, 96 * 2)).unsqueeze(dim=-1) # 假设每秒采集96个关节角度值 output = model(test_input) print(output.size()) # 应输出 (batch_size,) ``` 此代码片段展示了如何创建一个多尺度运动表现回归模型的基础结构,并进行了简单的前向传递操作验证其功能正常工作。 #### 应用场景 此类模型广泛应用于体育科学、康复医学等多个领域内的人体姿态重建与行为识别任务中。例如,在运动员训练监控方面可以帮助教练员更精准地评估选手的技术水平;而在临床环境中则可用于辅助医生诊断患者是否存在异常步态等问题。 #### 局限性 尽管上述方案具备一定优势,但仍存在一些挑战需要克服: - 数据预处理阶段可能引入噪声干扰; - 需要大量标注良好的样本才能达到理想效果; - 当面对极端情况下的非线性变换时,现有算法的表现可能会有所下降。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值