交通论文阅读与总结
最近在找点,做一个记录,跟的主要是郑宇老师团队的TaxiBJ和BikeNYC数据集上的论文,欢迎交流。
论文 | 时间关联 | 空间关联 | 其他(特点与不足) | 输入数据上的特点 |
STGCN | 在通道维度上使用,一维卷积, GLU控制信息流。Tin=12,Tout =1 | 二阶切比雪肤图卷积 | 静态图 | 静态图+动态特征 |
LSGCN | GLU | cosAtt(GAT)+GCN +gated |
| 静态图+动态特征 |
ASTGCN | 1维卷积,在同一节点的不同时间片做卷积 | Cheb net | 时间注意力和空间注意力机制 | 三变量预测一变量 |
MTGNN | GLU+扩散的inception结构 | Mixhop | Graph learning Layer+skip connection | 动态图可以学习边上的权重 |
STG2Seq | 长期编码器和短期编码器 | GCN | 长短期两部分注意力机制进行融合 |
|
交通预测方法总结
方法总览
论文概述
Challenge->contribution->solution(what,why,how)
1.UrbanFM: Inferring Fine-Grained Urban Flows
城市粗粒流与细颗粒流的空间相关性研究, 以及外部影响的复杂性,本文1) 利用特征提取模块和新的分布式上采样模块从粗粒度输入生成细粒度流分布的推理网络;2)综合考虑不同外部因素的影响,进一步提高融合子网的性能。
细粒度流图与粗粒度流图保持了空间和结构上的相关性,
贡献:
首次尝试将细粒度城市流推理问题形式化,识别问题的特殊性和相关挑战
粗粒度和细粒度级别
我们设计参考工作来处理这些空间关联。推理网络采用基于卷积网络的特征提取模块来处理邻近区域的影响。更重要的是,ITleveragesDistributionAlupSampling模块具有一个新的无参数层,名为N2规范化,通过将学习焦点从直接生成流量(如相关技术中)转换为推断实际流量分布,从而对模型施加结构约束
总结:从粗粒度到细粒度的推理预测,数据是网格类型的,整个模型偏向于视觉中的超分辨率。
2.Flow Prediction in Spatio-Temporal Networks Based on Multitask Deep Learning.10
预测流量(例如,车辆、人群和自行车的交通量),包括节点处的进出交通量和不同节点之间的过渡,
基于卷积的工作只考虑了节点上的属性(in out),而忽略了边上的属性,不同区域的相互影响;
文章认为节点上的进出交通流(节点流),和节点之间的过渡(边缘流)相互影响;
贡献:
文章提出了一个多任务学习的框架,可以通过时空网络同时预测节点流和边流量
挑战:
- 规模和复杂性,因为任意两个节点都可能存在转换流,任意两个地点是相连,相关和双向影响的
- 多重相关和外部因素模型
空间关联,远、近距离的;时间关联,时间临近性,周期性和趋势性。
第三,进出流和过渡流高度相关,相互加强;事件、天气和事故信息的处理
3)数据稀疏性
边图:OD图,很稀疏;In\out:节点属性图,OD图有N^2种可能,且在时间维度上变化比后者快;在如此高维空间中如此稀疏的转换是一个非常具有挑战性的任务
贡献:
- 文章提出了一个多任务学习框架来同时预测节点流和边流,分为节点网络和边网络;两者的损失由正则化建模;
- 节点网络和边网络各有三个输入组件,分为趋势,周期,临近;为了解决边图数据的稀疏性,文章设计了一个嵌入组件,将高维的稀疏输入嵌入到一个低维的空间中;
总体来说这篇论文做的还是很好的,遗憾的是没有开源数据和代码,边的转换关系应该是从最原始的订单 数据或轨迹数据处理得到的。我根据自己的理解实现了这个模型,代码仓库:
https://github.com/wanzhixiao/MDL
3.Revisiting Convolutional Neural Networks for Citywide Crowd Flow Analytics.11
文章探讨了卷积神经网络在城市人群流动分析中的应用
挑战:
文章指出,以往基于CNN的方法未能学习到全局的空间依赖;忽视了潜在的地区功能,为例解决上述问题,文章设计了一个名为DeepLGR的框架,包括三个部分,
1)局部特征抽取器用来学习每个区域的特征;
2) 全局上下文特征提取模块来提取并且上采样来获得全局信息;
3)基于张量分解的区域特定预测器,为每个区域提供定制的预测。
文章指出,在工作日早高峰期间,即使区域R1与R2相隔很远,也会存在通勤,因此需要捕获这种全局的特征,已有的方法通过堆叠CNN的层数来获取这种信息,如上图(b)所示。
贡献:
- 首次尝试用SE-Net来提取局部空间特征,SE-net可以融合不同通道的信息作为额外的信息(实际上是做了一个通道间注意力)
- 设计了一个全局上下文模块,该模块使用特定的池化方法将区域表示精确地聚合起来,然后将全局优先级返回到原始规模,以生成全局感知特征
- 提出了一种基于张量分解的区域特定预测器,它将预测因子的区域特定参数分解为更小的核心张量和伴随矩阵。
基线模型,将局部特征提取信息和全局特征提取信息进行拼接(通道维度),然后喂到一个区域特异性预测器中。
全局特征提取,通过四种不同尺寸的卷积核(1×1, 2×2, 3×3 and 4×4)金字塔网络进行池化,然后进行上采样,进行拼接:
下采样和上采样卷积和反卷积:
output = (input - k + 2p)/s + 1
input = (output - 1)* s + k - 2p
总结:结合了局部信息和全局信息,使用SE-Net提取局部特征(奇怪的是之前在ResNet上加SENet效果为什么不佳?),不同尺寸卷积核的金字塔网络提取全局特征。视觉中的卷积网络的应用(SE-Net+金字塔网络)
4. Matrix Factorization for Spatio-Temporal Neural Networks with Applications to Urban Flow Prediction.
挑战:
- 如何使模型考虑地区功能信息;
- 如何将框架推广到各种深层模型。
贡献:
- 一种ST特征学习器,它通过现有深层模型中相应的子网络从各个区域获取ST相关性的特征;
- 一种特定于区域的预测器,它利用所学的ST特征来进行区域特定的预测;特别是在神经网络中采用矩阵分解,即将预测器的特定区域参数分解为可学习矩阵,即区域嵌入矩阵和参数嵌入矩阵,以建立潜在区域函数和区域间相关性的模型。
这篇文章的核心是将地区功能纳入考虑,通过矩阵分解的方式来学习一个区域预测器,从而增加预测的准确度。