- 博客(7)
- 收藏
- 关注
原创 论文阅读:Video Visual Relation Detection via Iterative Inference
Video Visual Relation Detection via Iterative Inference基于迭代推理的视频视觉关系检测。论文地址:https://dl.acm.org/doi/abs/10.1145/3474085.3475263主要贡献提出了一种迭代关系推理方法,在其他两个组件的基础上逐步细化每个组件的类,可以利用关系组件的相互依赖性来实现更好的视觉关系识别;提出了一种新的训练方法来训练优先预测器,以便从可能正确的三元组合中更好地学习依赖性知识;提出了一个改进的VidV
2021-12-30 04:29:40
2052
原创 论文阅读笔记整理合集
视频关系预测相关1.一个同时提供动作标签和时空场景图标签的大型视频数据集合 Action Genome: Actions as Composition of Spatio-temporal Scene Graphs2. 用时空上下文的Transformer生成动态场景图 Spatial-Temporal Transformer for Dynamic Scene Graph Generation3. 视频视觉关系预测方法VidVRD Video Visual Relation Detection4.
2021-12-13 02:12:46
3319
1
原创 论文阅读:Action Genome: Actions as Composition of Spatio-temporal Scene Graphs
Action Genome: Actions as Composition of Spatio-temporal Scene GraphsAction Genome 是第一个同时提供动作标签和时空场景图标签的大型视频数据库。论文地址:https://arxiv.org/pdf/1912.06992.pdfGitHub地址:https://github.com/JingweiJ/ActionGenome官网地址:https://www.actiongenome.org/...
2021-12-13 02:03:28
2975
3
原创 论文阅读:Video Visual Relation Detection
Video Visual Relation Detection视频视觉关系预测方法VidVRD主要贡献出了一个新颖的VidVRD任务,旨在探索视频中物体之间的各种关系,它提供了一个比ImgVRD更可行的VRD任务;提出了一种VidVRD方法,通过目标轨迹建议、关系预测和贪婪关系关联来检测视频中的视觉关系;提供了第一个VidVRD评估数据集,包含1000个带有手动标记的视觉关系的视频。主要特点使用关系三元组<subject,predicate,object>∈C×P×C<
2021-12-12 00:53:56
1251
原创 论文阅读:Target Adaptive Context Aggregation for Video Scene Graph Generation
1. 提出一种新的视频级VidSGG检测跟踪范式,称为**目标自适应上下文聚合网络TRACE**,可以将关系预测的上下文建模与复杂的底层实体跟踪分离开;2. TRACE简化了VidSGG管道,是一种纯框架级的VidSGG框架,在**获取时空上下文信息**进行**关系识别**方面具有更模块化的框架;3. .在TRACE中,提出了一种自适应结构,称为层次关系树HRTree。用于**高效地组织可能的关系候选**,实现了候选关系之间的**上下文信息聚合**,还可以**节省内存**,从而获得比全连接图更好的性能。
2021-12-11 02:22:05
3044
1
原创 论文阅读:Beyond Short-Term Snippet: Video Relation Detection with Spatio-Temporal Global Contex
超越短片段:基于时空上下文的视频关系检测提出了一个滑动窗口方案,同时预测短期和长期关系。在对象tracklet上运行具有不同内核大小的窗口来生成具有不同持续时间的子tracklet;构建了一个时空图,并利用图卷积网络生成上下文,进行兼容性评估,只预测高度兼容的对的关系。该方法在ImageNet-VidVRD和VidOR数据集上跨多个任务实现了最先进的性能。
2021-12-10 00:42:58
2223
1
原创 论文阅读:Spatial-Temporal Transformer for Dynamic Scene Graph Generation
论文阅读:Spatial-Temporal Transformer for Dynamic Scene Graph Generation论文地址:https://arxiv.org/abs/2107.12309github地址:https://github.com/yrcong/sttranSSTran是一种可以利用时空上下文的Transformer (STTran: Spatial-Temporal Transformer)来生成动态场景图 (Dynamic Scene Graph).主要贡献
2021-12-08 23:45:10
3836
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人