MEMORY-AUGMENTED ATTENTION MODELLING FOR VIDEOS

本文介绍了一种针对视频描述任务的记忆增强注意力模型。该模型通过利用过去的注意力信息来改进当前的注意力分配,解决了现有模型难以捕捉视频及其描述中复杂高阶交互的问题。这种方法与人类的认知过程相似,能够更准确地推理视频中的关键信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文学习

MEMORY-AUGMENTED ATTENTION MODELLING FOR VIDEOS

作者: Rasool Fakoory, Abdel-rahman Mohamed,yy, Margaret Mitchellzy, Sing Bing Kangyy, Pushmeet Kohliyy
单位:Google,Microsoft Research,University of Texas at Arlington
杂志:ICLR
时间:2017
针对问题:现有的注意力机制模型不能建模高阶交互,如视频描述,因视频及其描述较为复杂。
解决方法:
1、提出基于记忆的注意力机制
2、当推理何处应该进行注意时,使用过去注意力的记忆;与人类认知的中央执行系统类似;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值