GSNet：Learning Spatial-Temporal Correlation from Geographical and Semantic Aspects for Traffic Accid

最新推荐文章于 2025-02-11 16:41:07 发布

原创

最新推荐文章于 2025-02-11 16:41:07 发布 · 1.2k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

GSNet是一种针对交通事故风险预测的深度学习模型，它通过学习地理和语义方面的空间时间相关性来提升预测准确性。该模型解决了传统模型考虑因素不全面以及零值膨胀的问题，采用特征融合和权重损失函数有效处理数据特点。实验结果显示，GSNet在与其他模型的对比中表现出优越性能。

GSNet：Learning Spatial-Temporal Correlation from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting（AAAI 2021）

提出问题：

导致交通事故因素很多(天气、时间、交通流量、POI等)，以往的模型考虑不全面；
零值膨胀(zero-inflated)问题：零值过多会导致预测不准确；
为提高预测准确性：考虑区域各方面的区域相关性：如下图，区域1和区域2相连接，两临近区域道路相连接，交通流会有相互影响。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

喷嚏O(∩_∩)O

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

行人重识别论文阅读2-视频中基于时空相关性和拓扑学习的行人重识别（CTL）

qq_33977080的博客

06-28

1425

[论文阅读]Spatial Temporal Graph Convolutional Networks for Skeleton-Based ActionRecognition

qq_60272314的博客

10-29

1856

目录一.概括二.传统GCN与本文ST-GCN之间的区别三.实现ST-GCN的细节一.概括传统的a骨骼建模方法通常依靠手工制作部分或遍历规则，从而导致表达能力有限和泛化困难.过往方法能力的限制在于不能精确的提取关节之间的空间关系，而这些空间关系对于理解人类活动是重要的。本文旨在开发一种有原则的、有效的动态骨骼建模方法，并将其用于动作识别。提出了一种新的 ST-GCN，即时空图卷积网络模型，用于解决基于人体骨架关键点的人类动作识别问题。通过自动从数据中自动学习空间和时间...

1 条评论您还未登录，请先登录后发表或查看评论

1 条评论

Key Board 2021.05.25
[face]emoji:062.png[/face][face]emoji:062.png[/face]

GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic

小蚂蚁与大象

08-23

1110

具体而言，时空地理模块将时空网格特征和时间特征作为输入，利用卷积、门控单元(GRU)和时间注意力对区域间的地理时空关联进行建模;然而，由于交通事故受多种因素影响，且对时空维度特征具有多尺度依赖性，因此对交通事故进行预测非常具有挑战性。在该模型中，设计了时空地理模块来捕获区域间的地理时空关联，设计了时空语义模块来建模区域间的语义时空关联。首先利用卷积对地理空间相关性进行建模，然后利用GRU和时间注意力机制动态捕捉地理空间的短期和长期时间相关性。图2展示了我们的GSNet模型的架构，该架构主要由两个模块组成，

AAAI 2020 GS-Net

Polaris

08-17

777

Geometry Sharing Network for 3D Point Cloud Classification and Segmentation（arXiv） brief summary：方法很简洁，写的也很清晰。比较有新意的是使用了特征空间这一点，有效的对远距离且结构相似的部分进行了捕获。 Abstract 大尺度的几何变换，如旋转、平移等对点云的分类任务有较大的影响，针对这一问题，设计了一个geometry sharing Network（GS-Net），对几何变换有较强的鲁棒性。GS-Net与现

读懂GSnet（一）：pandas读取pkl格式的多维数组，可视化理解时空数据

妈妈在家

10-12

3901

GSNet数据解读原始数据数据理解维度格式如何读取四维数组？读空间分布读时间分布读其它分布结语之前很少用过多维数组，不知道怎么读取。今天阅读论文《Learning Spatial-Temporal Correlation from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting（AAAI 2021）》时，文章提供的原始数据是4维的，正好研究一下。原始数据代码和原始数据：https://github.com/

STRCF：earning Spatial-Temporal Regularized Correlation Filters for Visual Tracking

weixin_53306805的博客

04-12

3010

在DCF中存在边界效应，SRDCF在DCF的基础上中通过加入spatial惩罚项解决了边界效应，但是SRDCF在tracking的过程中要使用到过去的多帧样本，带来了计算消耗。本文提出的STRCF在DCF的基础上加入了spatial和temporal正则项，且tracking过程中只使用上一帧的信息

论文翻译：STGAT: Modeling Spatial-Temporal Interactions for Human Trajectory

Sun_ZD的博客

12-09

8644

STGAT: Modeling Spatial-Temporal Interactions for Human Trajectory摘要1 引言2 相关工作3 Method4 实验5 结论 STGAT:为人类轨迹建模时空交互作用收录于ICCV 2019 作者：Huang Y, Bi H K, Li Z, et al. 论文地址：发表时间：ICCV2019 摘要大多数现有方法都忽略了与场景中其他行人交互的时间相关性。在这项工作中，我们提出了一种时空图注意力网络（STGAT），该网络基于序列到序列的体系

论文阅读：Spatial-Temporal Fusion Graph Neural Networks for Traffic Flow Forecasting

myblog

12-31

4917

Spatial-Temporal Fusion Graph Neural Networks for Traffic Flow Forecasting 问题：交通速度预测。数据集PeMS，METR-LA这两个数据集适合打榜动机：（1）道路之间的时空依赖性和复杂的动态变化趋势.现有的工作通过给定图结构会限制时空依赖的学习。（这点与ijcai2019,Graph waveNet;KDD 2020MTGNN，NIPS2020,ACGRN论点一致）（2）在解决复杂的时空数据时，现有的方法已经过时了：它们通常

《STA: Spatial-Temporal Attention for Large-Scale Video-Based Person Re-Identification》

三明治的博客

03-15

1288

提出了一种新的时空注意(STA)方法来解决视频中大规模的人物再识别任务。STA在空间和时间两个维度上充分利用了一个目标人的那些判别性部分，通过帧间正则化得到一个二维注意力评分矩阵来衡量空间部分在不同帧间的重要性。因此，根据挖掘的二维注意力评分矩阵指导的加权和操作，可以生成更鲁棒的剪辑级特征表示。在MARS和DukeMTMCVideoReID两个大规模数据集上进行了实验。mAP在MARS上达到87.7%

突破泛化和实用壁垒！GS-Net：首个跨场景泛化即插即用3DGS算法~

CV_Autobot的博客

09-27

1686

点击下方卡片，关注“自动驾驶之心”公众号戳我->领取自动驾驶近15个方向学习路线今天自动驾驶之心为大家分享首个具有跨场景泛化能力的即插即用3DGS模块！如果您有相关工作需要分享，请在文末联系我们！自动驾驶课程学习与技术交流群事宜，也欢迎添加小助理微信AIDriver004做进一步咨询>>点击进入→自动驾驶之心『3DGS』技术交流群编辑 | 自动驾驶之心写在前面神经辐射场（Neu...

（AAAI，2025）GSNet：面向开放词汇的遥感图像语义分割

lalula的博客

02-11

2516

我们提出了开放词汇表遥感图像语义分割，并提出了一个名为LandDiscover50K的定制数据集。我们提出了一个名为GSNet的新型框架，用于OVRSISS，首先通过DSIE提取通用和特定领域的特征，然后通过QGFF进行多源特征融合，最后通过RIPD进行信息保留和细节细化。我们进行了广泛的实验，以证明我们的GSNet大幅优于其他最先进的OVNISS方法，并且我们的LandDiscover50K显著提高了OVRSISS方法的性能。

Learning Spatial-Temporal Regularized Correlation Filters for Visual Tracking---随笔

weixin_30915951的博客

11-22

466

Learning Spatial-Temporal Regularized Correlation Filters for Visual Tracking DCF跟踪算法因边界效应，鲁棒性较差。SRDCF通过引入空间正则参数有效地提升了跟踪性能，但是增加了算法地复杂性。SRDCF在更新网络参数的时候，需要利用多张图片，这无疑增加了算法地运行效率。本文针对SRDCF，引入temporal reg...

GSNet: 开启智能车辆姿态与形状重建新时代

gitblog_00015的博客

06-15

673

????????GSNet: 开启智能车辆姿态与形状重建新时代 GSNet（Geometric and Scene-aware Network）是由一群创新的开发者创造的一个革命性项目，它将车辆姿态估计和三维形状重建提升到了新的高度。在单一RGB图像的基础上，GSNet能精准地进行六自由度（6DoF）车辆姿态估计和详细3D汽车形状重建，这一成就无疑为自动驾驶领域注入了强大的动力。 ????项目介绍 GSNet是基于...

【转载】时空数据挖掘论文 - AAAI 2021

入凡尘狼性不足

11-09

1262

【转载】时空数据挖掘论文 - AAAI 2021 转载于此，造福大众，感谢原作者今年AAAI2021接收论文投稿数为9034篇，总共有7911篇论文进行了评审，最终录取篇数为1692篇，接收率为21.4% 简介近日公布出了论文的接收列表，笔者对其中的时空数据挖掘相关的论文进行了梳理，共42篇，占总录取篇数比例为2.48%，具体如下： Deep Switching Auto-Regressive Factorization: Application to Time Series Forecasting.

论文阅读笔记：Traffic Anomaly Prediction Based on JointStatic-Dynamic Spatio-Temporal EvolutionaryLearning

ayuuuuu的博客

10-20

768

图卷积交通事故预测文章阅读笔记

Geometry Sharing Network for 3D Point Cloud Classification and Segmentation

qq_46403004的博客

01-04

1976

摘要问题：深度CNN在点云处理方面取得了一些进展，但在旋转、平移等大型几何变换方面处理得不够好，并影响了最终的分类性能。提出了一个几何共享网络GS-Net——可以有效的学习全局特征的点表述，增强网络对于几何变换的鲁棒性 GS-9Net在聚合点特征上提出了一个更加全局的方式： GS-Net包括几何相似性连接模块GSC，GSC提出了特征图，将距离远但是特征相似，几何相关的点聚合在一起，从而将欧式空间和特征空间上的邻近点进行聚合。这样的设计使得GS-Net可以有效地抓取局部和全局特征，例如对称性、曲

RGB-D、t、GSNet、p(t)goal、P(t)grip、RoI、D(t)grip 的汉语意思是什么呢？

weixin_43501408的博客

11-22

542

这些缩写共同描述了智能体如何通过RGB-D相机感知场景，使用GSNet预测抓取姿态，以及如何提取目标物体附近的点云以优化抓取动作。RGB-D、t、GSNet、p(t)goal、P(t)grip、RoI、D(t)grip 的汉语意思是什么呢？

基于Spatial-Temporal Transformer的城市交通流预测

zuiyishihefang的博客

07-13

5886

文章信息本周阅读的论文是题目为《Spatial-Temporal Transformer Networks for Traffic Flow Forecasting》的一篇2021年发布在arXiv网站上的使用时空Transformer网络（STTNs）预测交通流的文章。摘要交通预测已成为智能交通系统的核心组成部分。然而，由于交通流的高度非线性特征和动态的时空依赖性，及时...

论文笔记：Adaptive Graph Spatial-Temporal Transformer Network for Traffic Flow Forecasting

Zongyouqiangu的博客

11-26

4573

自注意力的思想是通过使用相应的查询键对查询其他token来更新每个令牌自己的值在该论文中中，作者提出了一种新的模型，称为ASTNN，用于交通预测的图结构时空建模。ASTNN是由堆叠的ST-Attention Block构建的，用于同时建模空间和时间相关性。作者使用局部多头自注意（L-MSA）来有效地计算时空图上的关注。此外，为了探索真实的空间相关性并提高局部时空注意力的性能，还引入了可学习自适应图，该图可以帮助目标节点选择相关节点进行关注。

STOP: Integrated Spatial-Temporal Dynamic Prompting for Video Understanding

最新发布

06-17

### Integrated Spatial-Temporal Dynamic Prompting for Video Understanding 技术解读 Integrated Spatial-Temporal Dynamic Prompting for Video Understanding 是一种结合空间和时间动态提示的方法，旨在通过增强视频理解模型的能力来捕捉复杂的时空特征[^1]。以下是该技术的关键点和技术细节： #### 1. 空间-时间动态提示的定义动态提示（Dynamic Prompting）是一种通过调整输入或模型内部表示来引导模型输出的技术。在视频理解任务中，Integrated Spatial-Temporal Dynamic Prompting 提出了一个框架，能够同时处理视频中的空间信息和时间序列信息。这种方法的核心是将动态提示分为两个维度：空间维度和时间维度[^2]。 #### 2. 空间动态提示空间动态提示主要关注视频帧内的像素级特征。通过引入可学习的空间提示向量（Spatial Prompt Vectors），模型可以更好地捕捉帧内的局部和全局特征。这些提示向量通常与卷积神经网络（CNN）或视觉Transformer（ViT）结合使用，以增强对物体、纹理和背景的理解[^3]。代码示例： ```python import torch import torch.nn as nn class SpatialPrompt(nn.Module): def __init__(self, in_channels, prompt_length=10): super(SpatialPrompt, self).__init__() self.prompt = nn.Parameter(torch.randn(prompt_length, in_channels)) def forward(self, x): B, C, H, W = x.shape prompt = self.prompt.unsqueeze(0).repeat(B, 1, 1) # Repeat for batch size prompt = prompt.permute(0, 2, 1).view(B, C, -1, 1) # Reshape to match input dimensions return torch.cat([x, prompt.expand(-1, -1, H, W)], dim=1) ``` #### 3. 时间动态提示时间动态提示则专注于视频的时间序列特征。通过对连续帧之间的关系进行建模，模型可以捕捉到动作、运动轨迹和其他时间依赖性信息。这通常通过递归神经网络（RNN）、长短期记忆网络（LSTM）或时间注意力机制实现[^4]。代码示例： ```python class TemporalPrompt(nn.Module): def __init__(self, in_channels, num_frames, prompt_length=5): super(TemporalPrompt, self).__init__() self.prompt = nn.Parameter(torch.randn(num_frames, prompt_length, in_channels)) def forward(self, x): B, T, C, H, W = x.shape prompt = self.prompt.unsqueeze(0).repeat(B, 1, 1, 1) # Repeat for batch size prompt = prompt.permute(0, 2, 3, 1, 4).view(B, T * C, H, W) # Reshape to match input dimensions return torch.cat([x.view(B, T * C, H, W), prompt], dim=1) ``` #### 4. 集成方法 Integrated Spatial-Temporal Dynamic Prompting 的核心在于将空间和时间动态提示无缝集成到一个统一的框架中。具体来说，这种方法通过以下步骤实现： - 在每一帧上应用空间动态提示。 - 将经过空间提示增强的帧作为输入，传递给时间动态提示模块。 - 最终输出是一个融合了空间和时间特征的表示，可用于下游任务如动作识别或视频分类[^5]。 #### 5. 实现方法为了实现 Integrated Spatial-Temporal Dynamic Prompting，可以采用以下步骤： - 使用预训练的视觉模型（如 ViT 或 Swin Transformer）作为基础模型。 - 在模型的早期阶段插入空间动态提示模块。 - 在模型的中间阶段插入时间动态提示模块。 - 通过微调整个模型来适应特定的视频理解任务。 #### 6. 优势与挑战 - **优势**：该方法能够显著提高视频理解模型的性能，特别是在复杂场景或多目标环境中[^6]。 - **挑战**：动态提示的引入增加了模型的计算开销，需要仔细设计提示长度和结构以平衡性能和效率。 ---