论文翻译
文章平均质量分 95
·Tu me manques
歪,
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
EgoVQA - An Egocentric Video Question Answering Benchmark Dataset
4、现存的数据集 在本节中,我们简要回顾了四个现有的第三人称的视频问答数据集,这些数据集是公开可用的并且在以前的工作通常会使用到。 在表1中,我们采用[21]中的现有数据集的统计信息并对其进行了少量修改。 我们还将在下一部分将它们与我们建议的EgoVQA数据集进行比较。 如表1第三人称部分所示,所有现有的视频问答数据集都是第三人称的视角。 1)TGIF-QA [35]是一个关于71741幅动画图片的超过165,000个问题的数据集,源自TGIF数据集[41]。 在此数据集上形成了多个任务,包括计算所原创 2021-01-05 16:39:39 · 1036 阅读 · 0 评论 -
论文笔记 - TSN
Temporal Segment Networks: Towards Good Practices for Deep Action Recognition摘要 本文旨在探索针对视频中行为识别的一种有效的 ConvNetConvNetConvNet 体系结构的设计,以及如何在有限的训练样本下来学习这些模型。贡献一:temporaltemporaltemporal segmentsegment...原创 2020-03-01 20:33:29 · 541 阅读 · 0 评论 -
翻译 - TSN
Temporal Segment Networks: Towards Good Practices for Deep Action RecognitionAbstract.深度卷积网络对于静止图像的视觉识别已取得了巨大的成功。然而,对于视频的行为识别,传统方法的优势并不那么明显。本文旨在探索针对视频中行为识别的一种有效的 ConvNetConvNetConvNet 体系结构的设计原则,并且用有...原创 2020-03-01 18:44:05 · 562 阅读 · 0 评论 -
论文笔记 - C3D
Learning Spatiotemporal Features with 3D Convolutional Networks翻译过这篇论文后,简单梳理一下本论文。一、摘要 提出了一种简单还有效的时空特征学习方法,它基于大尺度监督视频数据集上训练的深层三维卷积网络(3D3D3D ConvNetsConvNetsConvNets),其中发现三个方面:(1)相比于 2D2D2D ConvNe...原创 2020-02-22 14:58:50 · 658 阅读 · 0 评论 -
翻译 - C3D
Learning Spatiotemporal Features with 3D Convolutional NetworksAbstract 我们提出了一种简单是有效的时空特征学习方法,它基于大尺度监督视频数据集上训练的深层三维卷积网络(3D3D3D ConvNetsConvNetsConvNets)。我们的发现有三个方面:(1)相比于 2D2D2D ConvNetsConvNetsCon...原创 2020-02-22 10:18:06 · 748 阅读 · 0 评论
分享