Compression of Fully-Connected Layer inNeural Network by Kronecker Product
又是一篇压缩网络文章,但没有给出在imagenet上的错误率变化,有待观测。
Building a Large-scale Multimodal KnowledgeBase for Visual Question Answering
李飞飞视觉QA
KB示意图
系统流程图
Bottom-up and top-down reasoning withconvolutional latent-variable models
双向CNN,单元示意图
整体网络结构示意图
Deep Fishing: Gradient Features from DeepNets
Multimodal Deep Learning for Robust RGB-DObject Recognition
继视频、光流双输入后,又一双输入,把CNN改成googlenet或者vgg之后是不是又可以刷一篇?

本文探讨了深度学习领域的前沿技术,包括压缩网络、大规模多模态知识库构建、视觉问答系统的底层推理方法、从深层网络中提取特征、多模态深度学习在鲁棒RGB-D对象识别的应用,以及在不同输入条件下的深度学习模型优化。
1148

被折叠的 条评论
为什么被折叠?



