NLP：Attention和self-attention的区别

坠金

已于 2024-11-04 10:46:44 修改

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：八股技术面算法文章标签：自然语言处理人工智能

于 2023-10-07 11:35:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_41413211/article/details/133635805

技术面算法同时被 2 个专栏收录

71 篇文章 ¥15.90 ¥99.00

订阅专栏

24 篇文章 ¥9.90 ¥99.00

订阅专栏

本文探讨了自然语言处理中Attention和Self-Attention的概念。Attention机制允许模型在解码时关注输入的特定部分，增强上下文理解；而Self-Attention则聚焦于输入序列内部的关系，即使这些关系跨越较远距离。在计算上，Attention的权重基于当前输出和所有输入，而Self-Attention的权重基于输入序列各元素之间的相互关系，且Q=K=V，确保模型在生成输出时考虑自身所有输入。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

核心思想是根据不同的上下文为不同的信息分配不同的注意力权重

效果：

Attention：它允许模型在解码时聚焦于输入的特定部分，从而更好地捕获上下文信息。
Self-attention：它帮助模型捕获输入序列内部的关系，无论这些关系的距离有多远。

计算：

Attention：权重是基于当前的输出（或解码器状态）和所有的输入（或编码器状态）来计算的。
Self-attention：权重是基于输入序列的每一个元素与其他所有元素的关系来计算的。

数学：

self-attention比attention约束条件多了两个：

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

坠金 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。