娃娃亲�-优快云博客

原创论文阅读：Video Visual Relation Detection via Iterative Inference

Video Visual Relation Detection via Iterative Inference基于迭代推理的视频视觉关系检测。论文地址：https://dl.acm.org/doi/abs/10.1145/3474085.3475263主要贡献提出了一种迭代关系推理方法，在其他两个组件的基础上逐步细化每个组件的类，可以利用关系组件的相互依赖性来实现更好的视觉关系识别；提出了一种新的训练方法来训练优先预测器，以便从可能正确的三元组合中更好地学习依赖性知识；提出了一个改进的VidV

2021-12-30 04:29:40 2052

原创论文阅读笔记整理合集

视频关系预测相关1.一个同时提供动作标签和时空场景图标签的大型视频数据集合 Action Genome: Actions as Composition of Spatio-temporal Scene Graphs2. 用时空上下文的Transformer生成动态场景图 Spatial-Temporal Transformer for Dynamic Scene Graph Generation3. 视频视觉关系预测方法VidVRD Video Visual Relation Detection4.

2021-12-13 02:12:46 3319 1

原创论文阅读：Action Genome: Actions as Composition of Spatio-temporal Scene Graphs

Action Genome: Actions as Composition of Spatio-temporal Scene GraphsAction Genome 是第一个同时提供动作标签和时空场景图标签的大型视频数据库。论文地址：https://arxiv.org/pdf/1912.06992.pdfGitHub地址：https://github.com/JingweiJ/ActionGenome官网地址：https://www.actiongenome.org/...

2021-12-13 02:03:28 2975 3

原创论文阅读：Video Visual Relation Detection

Video Visual Relation Detection视频视觉关系预测方法VidVRD主要贡献出了一个新颖的VidVRD任务，旨在探索视频中物体之间的各种关系，它提供了一个比ImgVRD更可行的VRD任务；提出了一种VidVRD方法，通过目标轨迹建议、关系预测和贪婪关系关联来检测视频中的视觉关系；提供了第一个VidVRD评估数据集，包含1000个带有手动标记的视觉关系的视频。主要特点使用关系三元组<subject,predicate,object>∈C×P×C<

2021-12-12 00:53:56 1251

原创论文阅读：Target Adaptive Context Aggregation for Video Scene Graph Generation

1. 提出一种新的视频级VidSGG检测跟踪范式，称为**目标自适应上下文聚合网络TRACE**，可以将关系预测的上下文建模与复杂的底层实体跟踪分离开；2. TRACE简化了VidSGG管道，是一种纯框架级的VidSGG框架，在**获取时空上下文信息**进行**关系识别**方面具有更模块化的框架；3. .在TRACE中，提出了一种自适应结构，称为层次关系树HRTree。用于**高效地组织可能的关系候选**，实现了候选关系之间的**上下文信息聚合**，还可以**节省内存**，从而获得比全连接图更好的性能。

2021-12-11 02:22:05 3044 1

原创论文阅读：Beyond Short-Term Snippet: Video Relation Detection with Spatio-Temporal Global Contex

超越短片段：基于时空上下文的视频关系检测提出了一个滑动窗口方案，同时预测短期和长期关系。在对象tracklet上运行具有不同内核大小的窗口来生成具有不同持续时间的子tracklet；构建了一个时空图，并利用图卷积网络生成上下文，进行兼容性评估，只预测高度兼容的对的关系。该方法在ImageNet-VidVRD和VidOR数据集上跨多个任务实现了最先进的性能。

2021-12-10 00:42:58 2223 1

原创论文阅读：Spatial-Temporal Transformer for Dynamic Scene Graph Generation

论文阅读：Spatial-Temporal Transformer for Dynamic Scene Graph Generation论文地址：https://arxiv.org/abs/2107.12309github地址：https://github.com/yrcong/sttranSSTran是一种可以利用时空上下文的Transformer (STTran: Spatial-Temporal Transformer)来生成动态场景图 (Dynamic Scene Graph).主要贡献

2021-12-08 23:45:10 3836 1

wawaqing2333的博客