TrafNet:基于张量表示的辅助信息融合动态图神经网络用于交通流预测

       本文介绍的TrafNet模型是由我们实验室的师兄华毅然等人共同完成的。该研究提出了一种新的交通流预测方法,通过结合张量表示学习、动态图神经网络(DGCN)和辅助信息融合,显著提高了交通流预测的精度和效率。通过在多个公开数据集上的实验验证,TrafNet 模型表现出了较传统方法更优的性能。

论文题目

  • Tensor representation-based dynamic graph neural network for traffic flow prediction using auxiliary information

论文作者与单位

  • Jianli Zhao — 山东科技大学 计算机科学与工程学院

  • Yiran Hua — 山东科技大学 计算机科学与工程学院

  • Huan Huo — 悉尼科技大学(University of Technology Sydney)工程与信息技术学院

  • Qiuxia Sun(通讯作者) — 山东科技大学 数学与系统科学学院

  • Qing Li — 山东科技大学 数学与系统科学学院

  • Hailong Zhang — 山东科技大学 计算机科学与工程学院

发表信息

一、引言:城市交通预测的挑战

        随着城市化进程的不断加快,交通拥堵已成为全球范围内的普遍难题。高峰时段的车流量激增,不仅导致通勤时间显著延长,还造成燃油消耗增加、空气污染加重和能源浪费等一系列社会问题。为了缓解这一困境,各国正在积极推动智能交通系统(Intelligent Transportation System, ITS)的建设。ITS 的核心目标是通过对历史交通数据的分析与建模,预测未来的交通流变化,从而为信号灯控制、路径规划、交通调度以及自动驾驶等应用提供决策依据。

       然而,想要实现高精度的交通流预测并非易事。交通系统本质上是一个高度动态、复杂且非线性的网络结构,不同道路之间、不同时间段之间的关系随时在变化。传统的预测模型往往难以有效捕捉这种复杂的时空依赖关系。

        与此同时,交通数据本身也是多源异构的。道路传感器通常会同时记录多种信息,如流量(Flow)、速度(Speed)和占有率(Occupancy),这些特征之间往往具有密切的相关性。例如,在早晚高峰时段,当车流量迅速上升时,车辆速度往往显著下降;而在空间上,相邻路段之间的交通状态也可能存在同步变化或滞后效应。这种“时间上有周期性、空间上有依赖性”的特征,使得建模任务更加复杂。

        📊 图 1(Sensor layout and traffic data patterns)直观展示了这种复杂关系。图中每个传感器(如 A、B、C)都部署在不同的道路位置,用于采集实时交通数据。可以看到,在同一时间段内,不同位置的流量曲线变化明显不同,且流量与速度呈明显的负相关关系:当流量上升时,速度往往下降。此外,空间上相邻的传感器数据并非完全同步,表明不同路段之间存在动态、非线性的传播关系。这种差异说明,交通流并不是简单的时间序列问题,而是一个随时间动态变化的空间图结构问题

       长期以来,研究者们尝试使用不同方法来解决交通预测问题。传统的统计模型如 ARIMA 能够捕捉简单的线性趋势,但面对复杂的非线性交通变化时力不从心;深度学习模型如 LSTM、GRU 虽然可以建模时间序列的动态变化,但无法直接处理道路网络这种非欧几里得空间结构;而卷积神经网络(CNN)擅长提取局部空间特征,却难以在复杂的路网拓扑中应用。因此,这些方法往往存在结构单一、泛化能力弱、计算成本高等问题。

        近年来,图神经网络(Graph Neural Networks, GNNs)及其时空扩展版本(Spatiotemporal GNNs, STGNNs)为交通预测带来了新的可能。它们能在图结构上建模节点间的关系,结合时间序列建模手段,捕捉道路网络的时空依赖。然而,现有模型仍然存在不足:大多只利用单一类型的数据(如仅使用流量),忽略了速度、占有率等辅助信息;同时,模型参数量大、计算复杂度高,对动态关系的建模能力有限。

        基于此,本文作者提出了一种全新的方法——TrafNet(Tensor Representation-based Auxiliary Information Fusion Network)。该方法通过张量表示(Tensor Representation)动态图神经网络(Dynamic Graph Neural Network)相结合,有效融合多源交通信息,从局部与全局两个层面建模动态关系。TrafNet 不仅能显著提升预测精度,还在模型稳定性、参数效率和泛化能力上实现了突破,为智能交通系统的发展提供了新的研究思路。

二、研究动机与创新思路

        在过去的十年中,交通流预测领域经历了从统计模型到深度学习模型的快速演变。早期研究主要依赖传统的时间序列分析方法(如 ARIMA、VAR 等),这类方法结构简单、可解释性强,但假设交通变化是线性的、平稳的,因此在面对复杂的非线性动态场景时效果有限。

        随着深度学习的发展,研究者开始引入循环神经网络(RNN)、长短期记忆网络(LSTM)和卷积神经网络(CNN)来建模交通流的时空特征。它们在捕捉时间依赖关系方面表现出色,但仍面临一个根本问题:交通网络并不是一个规则的网格结构,而是一个由道路和交叉口组成的复杂图结构。这使得传统深度学习模型无法直接处理道路之间的非欧几里得空间依赖。

       为了解决这一问题,图神经网络(Graph Neural Networks, GNNs)被引入交通预测任务中。
基于图卷积的模型(如 DCRNN、GWNET、ASTGNN 等)能够利用邻接矩阵刻画路网中节点(传感器)之间的关系,实现对空间依赖的捕捉。

       现有的图神经网络模型存在几大不足:

  • 固定邻接矩阵:大多数模型假设节点间关系在整个预测过程中不变,但在实际交通场景中,道路间的相关性是动态变化的。例如,早高峰时主干道对周边路段影响较大,而夜间这种影响可能减弱或反转。如何捕捉这种动态关系是一个关键问题。

  • 单一特征输入:许多模型只使用流量数据,忽视了速度、占有率和天气等辅助信息。速度变化通常是交通状态变化的早期信号,合理融合这些信息能显著提升模型的预测能力。

  • 计算开销大:传统图神经网络在处理复杂动态关系时,通常面临计算开销大内存占用高的问题,导致难以应用于真实的交通系统。

       针对这些问题,本文作者提出了一种全新的模型框架——TrafNet(Tensor Representation-based Auxiliary Information Fusion Network)。TrafNet 的核心思想可以概括为一句话:

“用张量表示(Tensor Representation)构建动态图神经网络,并融合辅助信息提升交通流预测精度。”

       与以往的 STGNN 模型不同,TrafNet 在三个方面做出了创新性的改进:

  • 张量表示学习(Tensor Representation Learning)

    作者将交通时空数据建模为高维张量,并引入 Tensor Train (TT) 分解 来表示节点间的动态关系。这种表示方式既能降低模型参数规模,又能保留更多高阶交互特征,使得模型在复杂路网中依然高效稳定。

  • 动态图结构建模(Dynamic Graph Construction)

    TrafNet 不再依赖固定的邻接矩阵,而是通过 TT 分解动态生成随时间变化的邻接张量,从而更准确地描述不同时间步之间的节点关联。这使模型能够更灵活地捕捉交通流在空间与时间上的动态依赖模式。

  • 辅助信息融合(Auxiliary Information Fusion)

    模型同时输入流量、速度、占有率等多种特征,采用多通道卷积和注意力机制进行特征融合。辅助信息在一定程度上弥补了单一主特征对交通状态变化感知的延迟问题。

        通过这三项创新,TrafNet 实现了“结构轻量化、信息融合化、关系动态化”的统一设计。它不仅在预测精度上显著超过主流模型,还在参数数量和收敛速度方面展现出明显优势。

三、模型总体框架(TrafNet 概览)

       在明确了研究动机与目标之后,作者设计了一种结构高效、信息融合能力强的动态图神经网络框架——TrafNet(Tensor Representation-based Auxiliary Information Fusion Network)。该模型的总体结构如图 2 所示,主要由三个核心模块组成:数据嵌入层(Data Embedding Layer)辅助信息融合模块(Auxiliary Information Fusion Module)时序-特征增强模块(Temporal & Feature Enhancement Module)。这三个部分依次连接,从原始传感器数据出发,逐步提取时空特征,并最终完成交通流预测。

        模型由三大部分组成:数据嵌入层、辅助信息融合模块以及时序与特征增强模块。不同颜色的通道表示主特征(如流量)与辅助特征(如速度、占有率)的并行处理路径。张量分解部分负责生成动态图结构,从而捕捉时变的节点关系。

       在输入阶段,TrafNet 接收来自传感器的多源交通数据。这些数据通常包括三个主要特征:流量(Flow)、速度(Speed)和占有率(Occupancy)。作者将这些特征统一建模为一个高维张量(tensor),以便在后续模块中进行分解与动态建模。与传统的矩阵输入不同,张量表示能够同时保留多维时空信息,为后续的动态图构建提供了坚实基础。

1. 数据嵌入层(Data Embedding Layer)

        数据嵌入层的作用是将原始的交通时间序列转换为模型可处理的高维特征表示。该层通过卷积操作(Conv1D)和线性映射实现数据压缩和维度对齐,从而获得主特征和辅助特征的初始嵌入。在此阶段,模型并不直接计算邻接关系,而是为后续的动态图构建提供输入表示。嵌入后的特征可视为节点的时间动态描述,为后续的关系建模和时序捕捉提供支持。

2.辅助信息融合模块(Auxiliary Information Fusion Module)

       在这一模块中,TrafNet 首次体现出区别于传统 STGNN 的创新点。作者认为,交通系统中不同类型的特征(例如速度和流量)并非简单的相互独立,而是存在隐含的耦合关系。因此,模型采用了双通道结构:主干通道处理流量特征,辅助通道处理速度与占有率等补充信息。两条通道分别通过动态图卷积网络(Dynamic Graph Convolutional Network, DGCN)提取空间依赖特征,并在融合层中实现交互。这种设计有两个优点:一是可以在保持主特征稳定性的同时,动态引入辅助特征以提升预测敏感度;二是辅助信息的融合有助于模型更早感知交通状态的变化,从而实现更快的趋势响应能力

3.时序与特征增强模块(Temporal & Feature Enhancement Module)

       在获得融合特征后,模型需要进一步捕捉时间维度上的动态变化。作者采用了带有注意力机制的时序建模结构,对不同时间步的特征赋予自适应权重,从而强调关键时刻的动态影响。此外,为增强模型的全局感知能力,TrafNet 结合了 Transformer 的思想,引入多头注意力(Multi-head Attention)来聚合跨时间步信息。最终,模型通过张量分解生成的动态图邻接张量,实现了节点间随时间变化的连接关系,从而完成时空特征的联合建模。

       总体来看,TrafNet 的设计遵循了“分层提取、并行融合、动态建模”的思路:数据嵌入层负责基础特征转换;辅助信息融合模块实现多源数据的交互;时序增强模块建模动态依赖并输出预测结果。这种结构既能充分挖掘时空相关性,又能通过张量分解有效减少参数量,使模型在预测精度与计算效率之间取得良好平衡。

四、关键技术模块解析

        TrafNet 模型的创新性不仅体现在其架构设计上,更在于其所采用的技术手段。这一部分将详细解析 TrafNet 中的几个关键模块,包括 张量表示学习动态图构建辅助信息融合,并结合具体的图示和公式解释它们是如何协同工作的。

1.张量表示学习(Tensor Representation Learning)

        TrafNet 的第一个核心技术是 张量表示学习。与传统的矩阵表示不同,张量能够同时捕捉数据的多个维度。在交通流预测中,交通数据不仅有时间维度(如流量、速度随时间变化),还有空间维度(如不同路段间的流量关联)。TrafNet 将这些时空数据建模为三维或更高维度的张量,以便在训练过程中提取更多的交互特征。通过使用 Tensor Train (TT) 分解,模型能够将高维张量分解成多个低维矩阵,从而有效减小计算量并提升学习效率。

图 3 展示了如何通过 Tensor Train (TT) 分解 将高维张量拆分成低秩的因子矩阵,进而降低计算复杂度并捕捉数据中的高阶关系。该分解方式可以提高动态关系建模的表达能力,同时有效减少模型的参数量。

        TT 分解的关键优势在于能够保持数据的高阶交互关系的同时,通过低秩矩阵的组合,使得每个维度的特征表示更加简洁有效。通过这种方式,TrafNet 解决了高维数据带来的计算瓶颈,并能在 时间与空间 维度上高效地建模节点之间的依赖关系。

2.动态图构建(Dynamic Graph Construction)

        TrafNet 的第二个创新技术是 动态图构建。传统的图神经网络(GNN)通常假设图的结构是静态的,即每个时间步的邻接矩阵都是固定不变的。然而,交通流具有明显的时变特性,路段之间的关联关系会随着时间而变化。例如,在早高峰时段,主干道的车流量会影响到周围道路的交通状态,而在夜间这种影响关系可能会减弱。因此,TrafNet 引入了 动态图卷积网络(DGCN),通过随时间变化的邻接张量来建模时空依赖关系。

       TT 分解在动态图构建中的应用是其核心之一。通过 Tensor Train 分解生成的动态图邻接张量,不仅捕捉了节点间的局部依赖,还能通过图结构的动态变化表示交通流的时空特性。
这种方法避免了固定邻接矩阵的局限,使得 TrafNet 在动态交通环境中具备了更强的适应性。

3.辅助信息融合(Auxiliary Information Fusion)

       交通流的预测不仅依赖于主特征(如流量),还需要考虑其他辅助特征,如 速度占有率。这些辅助信息能够提供额外的时空维度,有助于更准确地预测交通流的变化趋势。TrafNet 在这一点上做了进一步的优化:通过多通道结构并行处理主特征和辅助特征,利用 动态图卷积(DGCN) 捕捉它们之间的空间和时间依赖性。

       例如,速度的变化往往是交通流变化的先导信号,TrafNet 在模型的中间层将速度与流量等信息融合,并通过注意力机制(Attention Mechanism)和 Transformer 模块进一步增强特征表示。
这种融合方法可以帮助模型更早地感知到交通状态的变化,从而提升预测的准确性和响应速度。

五、实验设计与数据集

        为了验证 TrafNet 模型的有效性,作者在三个公开的交通流数据集上进行了大量实验。这些数据集不仅覆盖了多种交通场景,还包含了不同时间段、不同天气和不同地理位置的交通信息,能够很好地测试模型在各种环境下的鲁棒性与泛化能力。

1. 数据集概述

       TrafNet 在以下三个交通流数据集上进行实验:

  • PeMSD3:该数据集来自美国加利福尼亚州的交通传感器,包含了约 170 个路段的流量数据,时间跨度从 2017 年到 2018 年。数据主要以每 5 分钟为单位进行记录,包含了交通流量、车速和占有率等特征,覆盖了不同交通状态(高峰期、平峰期等)。

  • PeMSD4:该数据集也是来自加利福尼亚州,包含了约 307 个路段的交通流数据。数据记录包括流量、速度和占有率等信息,时间跨度同样为 2017 到 2018 年,主要用于验证模型在大规模交通网络上的表现。

  • PeMSD8:PeMSD8 数据集覆盖了更广泛的地区,包含了 170 个路段,数据记录时间跨度更长,涵盖了不同季节和天气条件的交通数据。数据包括车速、流量和占有率等特征,且在高峰时段的交通密度较大,能够有效测试模型在复杂交通场景下的表现。

2. 数据预处理与特征选择

      为了使模型更好地学习交通流的时空特征,所有数据都经过了严格的预处理。

  • 缺失值处理:对于部分缺失的传感器数据,采用了插值法进行填补,确保数据的完整性。

  • 归一化:为了减少不同特征之间的量纲差异,所有的流量、速度和占有率数据都进行了归一化处理,使其值域都在 0 到 1 之间。

  • 时间窗口划分:为了训练时序模型,每个数据样本都被划分为一个固定时间窗口(例如,过去 12 小时的数据),以便模型学习到时序依赖关系

3. 实验设置

为了全面评估 TrafNet 的性能,作者将其与10 多个主流交通流预测模型进行了对比,包括:

  • DCRNN(Diffusion Convolutional Recurrent Neural Network)

  • GWNET(Graph-WaveNet)

  • ST-MAN(Spatiotemporal Multi-Channel Attention Network)

  • ASTGNN(Attention-based Spatiotemporal Graph Neural Network)

超参数设置

TrafNet 的实验中,作者选择了以下超参数:

  • 学习率(Learning Rate):采用 Adam 优化器,学习率设置为 0.001。

  • 批次大小(Batch Size):根据数据集大小选择合适的批次大小,PeMSD3 和 PeMSD4 设置为 64,PeMSD8 设置为 32。

  • 训练轮数(Epochs):模型训练了 50 轮,每轮进行 5 次交叉验证,确保模型稳定收敛。

  • 邻接矩阵构建:利用 Laplacian Eigenmaps 初始化邻接矩阵,以提升训练过程的稳定性。

  • 张量秩(Tensor Rank):为了平衡模型复杂度和预测能力,设置张量分解的秩为 3。

计算环境

  • GPU配置:使用 NVIDIA Tesla V100 GPU 进行模型训练。

  • 框架:所有实验都基于 PyTorch 框架实现,确保高效的计算和自动微分支持

4.实验评估指标

在实验中,作者使用了以下评价指标来衡量 TrafNet 模型的预测性能:

  • MAE(Mean Absolute Error,平均绝对误差)

  • RMSE(Root Mean Square Error,均方根误差)

  • MAPE(Mean Absolute Percentage Error,平均绝对百分误差)

这些指标能够全面评估模型在交通流量预测中的精度、稳定性和泛化能力。
特别是 MAE 和 RMSE,被广泛用作时间序列预测问题中的常用评估标准。

5.实验流程

实验流程如下:

  1. 数据预处理:从原始数据中提取流量、速度和占有率特征,并进行归一化。

  2. 数据切割:将数据按时间窗口划分为训练集、验证集和测试集。

  3. 模型训练:使用上述超参数和数据集进行模型训练,并在验证集上进行调优。

  4. 结果评估:在测试集上计算 MAE、RMSE、MAPE 等指标,并与其他主流模型进行对比。

六、实验结果与分析

        在本节中,我们将展示 TrafNet 模型在 PeMSD3PeMSD4PeMSD8 数据集上的实验结果,并将其与 10 多个主流交通流预测模型进行对比。实验结果表明,TrafNet 在预测精度收敛速度计算效率等方面都具有显著优势。

1.实验结果对比

       作者将 TrafNet 与以下模型进行了对比:

  • DCRNN(Diffusion Convolutional Recurrent Neural Network)

  • GWNET(Graph-WaveNet)

  • ST-MAN(Spatiotemporal Multi-Channel Attention Network)

  • ASTGNN(Attention-based Spatiotemporal Graph Neural Network)

  • 其他经典模型:ARIMA、LSTM、CNN 等

MAE、RMSE 和 MAPE 对比

       图8展示了TrafNet在不同数据集上的交通流预测结果可视化,对比了模型预测值与真实观测值随时间变化的曲线。可以看到,TrafNet的预测曲线整体紧贴真实值,尤其在交通流量的峰值与谷值处能较准确地捕捉趋势变化,表明模型具备较强的时序建模与动态响应能力。少数偏差主要出现在突发波动时段,说明极端交通变化仍存在一定预测难度。

      实验中使用 MAE(Mean Absolute Error)、RMSE(Root Mean Square Error) 和 MAPE(Mean Absolute Percentage Error) 来评估模型的预测精度。下表展示了各模型在 PeMSD3、PeMSD4 和 PeMSD8 数据集上的实验结果:

       表2结果表明,TrafNet在三个PeMS数据集上整体表现最优,尤其在特征更丰富的PeMSD4和PeMSD8上,其MAE、RMSE、MAPE表现良好,验证了张量表示与动态图融合的有效性。相比ST-MAN等多源模型,TrafNet在保持相似或更高精度的同时大幅降低参数量与计算复杂度,体现出更好的效率与稳定性;仅在较简单的PeMSD3上优势不明显,说明其在多源复杂交通场景中更具优势。

计算效率对比

        除了预测精度,计算效率也是衡量模型性能的重要标准。TrafNet 模型通过张量分解的方式有效减少了模型的参数量,从而降低了计算开销。在计算效率方面,TrafNet 相较于其他模型具有明显的优势:

       表8比较了TrafNet与多种主流模型在三个数据集上的模型复杂度和训练/推理速度。结果显示,TrafNet在保持较高预测精度的同时,参数量(约31–34万)远低于如ASTGCN、STSGCN等大型模型,仅略高于轻量模型DSFormer-LRTC和LightCTS;其训练与推理时间也处于较低水平(例如在PeMSD8上仅14.05s/1.50s每轮)。这表明TrafNet在模型规模与效率之间实现了良好平衡:既具较强的时空建模能力,又保持较高的计算效率与实际可部署性。

       图7展示了TrafNet与若干基线模型在训练过程中的收敛曲线(横轴为训练轮数,纵轴为验证/训练损失),用于比较各模型的收敛速度与最终稳定性。从曲线可以看出,TrafNet 的损失下降更快且更平滑——通常在约 30 个 epoch 内就达到稳定区间并保持较低的验证损失——而多数基线模型的损失下降更缓慢且波动更大,部分模型在后期存在明显震荡或收敛到更高的损失值。总体而言,图7 客观反映出 TrafNet 不仅最终精度更优(较低的稳定损失),也具有更快的收敛速度和更好的训练稳定性。

2.结果分析

  • TrafNet的优势

       TrafNet在整体性能上表现出较好的平衡性。实验结果表明,模型在多个数据集上均取得了较低的MAE、RMSE和MAPE值,验证了其在时空特征建模方面的有效性。同时,表8显示TrafNet在参数规模和训练推理时间上均保持较低水平,相较于ASTGCN、STSGCN等大型模型具备更高的计算效率。尽管模型结构相对紧凑,但其预测精度仍能与ST-MAN等复杂模型持平或略优,体现了较好的性能–效率平衡。

  • 模型在不同数据集上的表现差异

        从表2可以看出,TrafNet在PeMSD4和PeMSD8两个数据集上取得了最优或接近最优的结果,而在PeMSD3上优势相对较小。这说明模型在处理包含多源信息和更复杂交通模式的数据集时效果更为显著。由于PeMSD8数据集包含速度与占有率等额外特征,TrafNet能够更充分发挥其动态图建模与特征融合机制的优势,因此在该数据集上表现最佳。

  • 辅助信息融合的作用

        对比单源模型与多源模型的实验结果可知,引入速度、占有率等辅助特征能有效提升模型性能。TrafNet通过在张量表示框架下融合多源数据,使模型在捕获动态时空关系方面更加灵活。虽然提升幅度随数据集而异(通常在几个百分点范围内),但总体趋势表明辅助信息确实对预测精度有积极影响,尤其在交通模式变化较大的数据集上更为明显。

七、消融实验分析

      消融实验与模块重要性分析

       为了进一步验证 TrafNet 中各模块对性能的贡献,我们进行了消融实验,逐步去除模型的不同组件,分析其对整体预测性能的影响。以下是消融实验的设计与结果。

实验设置

       我们设计了以下几种消融配置,以便评估不同模块对模型性能的贡献:

  • Shared period embedding(去除共享周期嵌入)
    删除了模型中用于捕获时间周期特征(如一天中不同时间段、星期几等)的共享时间嵌入部分。该模块原本帮助模型学习交通的周期性规律(如早晚高峰)。去除后模型无法共享全局周期信息,导致时序特征建模能力下降。

  • Dynamic graph module(去除动态图模块)
    移除了基于张量表示的动态图构建与动态图卷积模块。这部分是 TrafNet 的核心,用于动态捕捉多源数据(流量、速度等)之间的时空关系。去掉后模型只能依赖静态或简单的邻接结构,显著削弱了局部动态相关性的建模能力。

  • LE Initialization(去除拉普拉斯特征初始化)
    不再使用Laplacian Eigenmaps(LE)初始化来为张量分解因子提供基于路网结构的先验。也就是说,节点因子矩阵由随机初始化而非结构特征初始化,导致模型在训练早期稳定性和收敛速度下降。

消融实验结果

       以下表格展示了不同消融配置下,TrafNet 在三个数据集上的实验结果:

       表6展示了TrafNet在去除不同模块后的消融实验结果。可以看出,完整模型在三个数据集上均取得最低的MAE、RMSE和MAPE,说明各组件均对性能提升有贡献。其中,移除动态图模块后误差上升最明显,表明其在捕捉多源数据动态关系中起关键作用;去除共享周期嵌入Laplacian Eigenmaps 初始化也会导致精度下降,但影响相对较小。这表明三者共同协作可有效提升模型的时空依赖建模与预测准确性。

八、总结与未来展望

1.总结

        随着智能交通系统(ITS)的发展,交通流预测在城市交通管理中扮演着越来越重要的角色。然而,传统的交通流预测方法往往忽视了交通网络的时空动态关系,导致其在面对复杂交通环境时表现不佳。为了克服这一问题,本文提出了一个全新的模型——TrafNet(Tensor Representation-based Auxiliary Information Fusion Network),该模型成功地将张量表示学习动态图神经网络辅助信息融合相结合,解决了多源异构数据和复杂时空关系建模的问题。

        通过广泛的实验验证,TrafNet 在 PeMSD3PeMSD4PeMSD8 等多个公开数据集上取得了领先的预测精度,并且在计算效率上也优于现有的主流模型。尤其是在多源数据融合方面,TrafNet通过并行处理流量、速度和占有率等特征,显著提升了模型对交通流变化的敏感度。

        在实验结果消融分析可解释性分析的支持下,TrafNet 证明了其在时空动态建模计算效率优化以及多源数据融合等方面的优势,为智能交通系统提供了更加精准和高效的预测工具。

2. TrafNet 的优势与贡献

        TrafNet 的核心优势在于其高效的时空建模能力灵活的多源数据融合策略。具体来说,TrafNet 的创新贡献体现在以下几个方面:

  • 张量表示学习:通过引入 Tensor Train (TT) 分解,TrafNet 能够在高维数据的同时,减少计算开销并提升模型的表达能力。这一创新使得模型能够在处理复杂的时空数据时,保持较高的计算效率。

  • 动态图构建:TrafNet 通过动态图卷积网络(DGCN)实现了交通流网络的动态建模,能够根据不同时间步的交通流变化动态调整路段间的关联关系。这一特性是传统图神经网络模型无法实现的,确保了 TrafNet 在实时交通预测中的适用性。

  • 辅助信息融合:TrafNet 在输入数据中不仅包括了流量,还融入了速度占有率等辅助信息,提升了对交通流变化的捕捉能力。多源数据的融合使得 TrafNet 能够在更加复杂的交通环境中保持较高的预测精度。

3. 未来展望

        尽管 TrafNet 在多个交通流预测任务中表现出色,但仍然有一定的提升空间,未来的工作可以从以下几个方面进行优化和扩展:

1. 引入更多的外部因素

        目前,TrafNet 主要依赖于流量、速度和占有率等基本交通特征,未来可以进一步引入天气信息节假日效应事件数据等外部因素。这些因素通常对交通流有着显著的影响,尤其是在特殊时段或复杂天气条件下,TrafNet 可以进一步提升其鲁棒性和预测准确度

2. 跨领域应用与泛化

      TrafNet 主要应用于城市交通流预测,但其核心技术框架(如张量表示学习、动态图建模等)也可以推广到其他领域。例如,社交网络分析电力负载预测金融市场预测等,TrafNet 的多源数据融合与时空依赖建模能力可以有效地应用于这些领域,提升预测精度。

3. 与大模型的融合

        随着大规模预训练模型(如 GPT、BERT 等)的崛起,TrafNet 与大规模语言模型(LLM)的结合也充满潜力。例如,使用大模型进行交通流预测的趋势分析、异常事件识别等高层次任务,可以为 TrafNet 提供更强的上下文感知和推理能力。

附页

论文中还有其他的表格和图,在此简要说明:

  • Table 3 — 不同张量分解方法(Tucker / TT)及不同秩设置下的性能与参数对比。

  • Table 4 — 不同多源融合方法(直接相加、门控、交叉注意力、直接动态图、论文提出的张量动态图)在指标、参数与训练/推理时间上的比较。

  • Table 5 — 各种因子初始化方法(零、随机、Xavier、He、Laplacian Eigenmaps 等)在 PeMSD4 上的性能比较。

  • Table 7 — 将速度与占有率加入后的可扩展性试验:不同特征组合(Flow / Flow+Speed / Flow+Speed+Occupancy)对应的性能与参数量对比。

  • Fig. 4 — Illustration of the L-TCN model
    轻量级时间卷积网络(L-TCN)的结构示意图,展示了因果卷积、膨胀卷积及SE模块如何提取时间特征。

  • Fig. 5 — Illustration of feature enhancement modules
    特征增强模块示意图,左侧为Transformer结构(捕捉空间关系),右侧为SE Block结构(通道注意力加权)。

  • Fig. 6 — Visualization of dynamic graph tensors on different datasets
    不同数据集下动态图张量的可视化结果,展示模型在不同时间片对道路节点相关性的学习效果。

  • Fig. 9 — Ablation comparison of dynamic graph construction
    动态图构建方式的可视化比较,说明引入张量分解和Laplacian初始化后动态图结构的变化与改进。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值