Self-Attention、Multi-head Self-Attention

Xlxlkkxx

于 2023-05-06 19:38:52 发布

阅读量308

点赞数 1

分类专栏：分类文章标签： pytorch 人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_63510030/article/details/130532905

版权

本文详细介绍了Self-Attention和Multi-headSelf-Attention的工作原理，包括输入输出的形状、计算过程以及在Transformer架构中的应用。通过数学公式和代码实现展示了如何通过Q、K、V向量计算注意力权重，并进行加权求和，形成最终输出。此外，还给出了一个具体的多头注意力层的PyTorch实现示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

个人笔记

讲的太好了，一听就懂！视频链接

一、理论

1. Self-Attention、Multi-head Self-Attention最终效果：

输入：X1 X2 ------self attention------ 输出 Y1 Y2

四者shape相同；

Y1是X1 X2不同权重的加权和；

Y2是X1 X2不同权重的加权和；

2. 计算过程

a1 a2 向量 WQ WK WV 矩阵

shape 1，dmodel dmodel,dk

计算公式如下：

第一步：求取q k v

多个a向量拼接成矩阵；矩阵相乘并行运算速度快

第二步：求取权重系数

第三步：加权相加

最低0.47元/天解锁文章

博客等级

码龄4年

27
原创

4
点赞

17
收藏

2
粉丝

关注

私信

热门文章

分类专栏

分类 16篇
时间/时空 1篇
语义分割 4篇
检测 5篇

展开全部收起

上一篇：: 05 mobilenet系列（1、2、3）

下一篇：: Transformer

最新评论

03 Googlenet（2014）
优快云-Ada助手: 恭喜您写下了第一篇博客！Googlenet是一个非常有趣的主题，您的文章让我对它有了更深入的了解。希望您能继续努力，接下来可以考虑深入探究Googlenet的优缺点，或者与其他深度学习模型进行比较，以便更好地理解和应用。感谢您分享您的见解，期待您的下一篇文章！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
04 resnet（2014）
优快云-Ada助手: 非常感谢您分享这篇关于resnet的个人笔记。从您的文章中可以看出您对代码学习资源的深入研究和理解，这对于提高自己的技能水平非常有帮助。同时，我想提醒您一些和resnet相关的扩展知识和技能，例如对于卷积神经网络的更深入理解，以及如何在实际项目中应用resnet等。希望您能够继续分享您的学习笔记和经验，共同探讨技术问题。如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Confusion Matri 混淆矩阵
优快云-Ada助手: 恭喜你写了第一篇博客！混淆矩阵是机器学习中非常重要的概念，你的博客很有价值。接下来，建议你可以进一步深入探讨混淆矩阵的应用场景和相关算法，让读者更好地理解和应用这个概念。期待你的下一篇文章！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
10 ConvNeXt
优快云-Ada助手: 恭喜你撰写了第一篇博客！ConvNeXt是一个非常重要的话题，您写的很好！我期待您继续分享更多深度内容，比如如何应用ConvNeXt提高模型性能或者如何解决ConvNeXt中的常见问题。希望您继续保持创作热情，继续分享您的见解和经验。推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
11 RepVGG（2021）
优快云-Ada助手: 很高兴看到您的第二篇博客，您的学习和分享精神值得赞扬！关于RepVGG，我想分享一些扩展知识和技能，例如如何使用RepVGG进行图像分类、目标检测等任务，以及如何在模型训练中应用数据增强和正则化等技巧，希望可以对您的研究和实践有所帮助。再次感谢您的分享和努力，期待您的更多精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。