MMTM: Multimodal Transfer Module for CNN Fusion
论文:MMTM: Multimodal Transfer Module for CNN Fusioncode:https://github.com/haamoon/mmtm**简介:**这是一篇关于多模态融合方法的论文,多模态融合的目的就是从不同的模态中提取到互补的相关信息,从而达到比单模态更好的性能。模态融合的技术被广泛的使用到不同的深度学习任务中(视频分类、动作识别、情感识别和音频视觉语音增强等),现在的主流融合方法都是在网络最后的输出层进行融合。在这篇论文中,作者提出了一个简单的模态转换模块MMT
原创
2020-11-15 20:58:15 ·
1930 阅读 ·
1 评论