Scale-awareFast R-CNN for Pedestrian Detection
AggregatingDeep Convolutional Features for Image Retrieval
这种特征aggregate的方式,在几个数据集上有一定增长
LearningMulti-Domain Convolutional Neural Networks for Visual Tracking
multitask在视觉跟踪中的应用
VideoParagraph Captioning using Hierarchical Recurrent Neural Networks
度长在视频段落描述方面的一个力作
Attention with Intention for a Neural Network Conversation Model
EmpiricalStudy on Deep Learning Models for QA
IBM Watson

本文探讨了视觉与视频理解领域的最新进展,包括规模感知的行人检测、深度卷积特征聚合、多域卷积神经网络在视觉跟踪的应用、利用层次递归神经网络进行视频描述生成,以及带有意图注意力机制的对话模型等。这些技术不仅展示了深度学习的强大能力,还为视觉理解提供了新的解决方案。
2581

被折叠的 条评论
为什么被折叠?



