学习笔记_外部att

赫瑟尔

已于 2022-04-05 12:01:14 修改

阅读量352

点赞数

分类专栏：深度学习文章标签：深度学习

于 2022-04-05 11:58:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_42075634/article/details/123967031

版权

本文探讨了Self-Attention的高计算复杂度问题及忽略样本间联系的不足，提出了External Attention（EA）。通过使用两个串联MLP作为memory units，EA将计算复杂度降至O(n)，并利用全训练数据学习，考虑了样本间联系，实现了多头外部注意力机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

External Attention（EA）详解
要解决的Self-Attention(SA)的两个痛点问题：
（1）O(n^2)的计算复杂度；
(2)SA是在同一个样本上根据不同位置计算Attention，忽略了不同样本之间的联系。
因此，本文采用了两个串联的MLP结构作为memory units，使得计算复杂度降低到了O(n)；
此外，这两个memory units是基于全部的训练数据学习的，因此也隐式的考虑了不同样本之间的联系。
在这里插入图片描述

from model.a

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。