transformer理解

yang_daxia

已于 2023-07-25 16:30:56 修改

阅读量724

点赞数

CC 4.0 BY-SA版权

分类专栏：自动驾驶深度学习理论文章标签： transformer 深度学习人工智能

于 2023-07-25 16:19:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yang_daxia/article/details/131918993

深度学习理论同时被 2 个专栏收录

45 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

4 篇文章

订阅专栏

本文深入探讨Transformer模型，重点解释了Q、K、V在自注意力机制中的作用，以及为何需要位置编码。通过多头自注意力和Encoder-Decoder结构的分析，展示了Transformer的工作原理。同时，提到了位置编码的不同方案，如三角函数方式，以弥补模型中丢失的位置信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

transformer的理解

Q、K、V的理解

核心是自注意力机制。即每个位置的结果为所有位置的加权平均和。为了得到每个位置的权重，需要Q*K得到。
在这里插入图片描述

整个多头的self-attention过程

在这里插入图片描述

单个encoder

在这里插入图片描述

encoder-decoder

encoder中的K和V会传到decoder中的encoder-decoder attention中。
在这里插入图片描述

了解本专栏

超级会员免费看

博客等级

码龄7年

214
原创

485
点赞

1061
收藏

425
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: BEV based depth方法总结

下一篇：: ROS入门核心教材重要节选

最新评论

论文阅读VACE: All-in-One Video Creation and Editing
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
git 常用功能，误删，版本回退等
优快云-Ada助手: 如何在 Git 中处理子模块？
videoLDM:Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Animate Anyone 2: High-Fidelity Character Image Animation with Environment Affordance论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
LDM——High-Resolution Image Synthesis with Latent Diffusion Models论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

yang_daxia 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。