【神经网络与深度学习】Transformer原理

abutu999

于 2024-05-15 20:57:09 发布

阅读量1.3k

点赞数 32

分类专栏：深度学习与神经网络文章标签：深度学习神经网络 transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/vox520/article/details/138918739

版权

transformer

在这里插入图片描述

ENCODER

在这里插入图片描述

输入部分

对拆分后的语句x = [batch_size, seq_len]进行以下操作

Embedding
将离散的输入（如单词索引或其他类别特征）转换为稠密的实数向量，以便可以在神经网络中使用。
位置编码
与RNN相比，RNN是一个字一个字的输入，自然每个字的顺序关系信息就会保留下来。但在Encoder中，一个句子的每一个字（词）是并行计算的（下一节解释），所以我们在输入的时候需要提前引入位置信息。
位置信息由： pos（一句话中的第几个字）和 i （这个字编码成向量后的第i维) 来确定
下面是Positional Encoding的公式：
i为偶数时 , $PE_{pos, i}= sin( pos/ 10000^{2i/ d_{model}})$
i为奇数时 ,

最低0.47元/天解锁文章

博客等级

码龄3年

67
原创

598
点赞

393
收藏

463
粉丝

关注

私信

热门文章

分类专栏

最新评论

【神经网络与深度学习】Transformer原理
征途黯然.: 这篇关于神经网络与深度学习Transformer原理的文章非常有启发性。
【数据结构】17 二叉树的建立
白话机器学习: 文章写得专业、深入、详细，收藏啦
【每日一题】04最小路径和（DP3）
优快云-Ada助手: 亲爱的博主，恭喜你持续更新博客，分享了第19篇关于最小路径和的题目解析。我觉得你在解题的思路和方法上都做得非常好，不过我想提供一些建议，或许可以考虑增加一些实际案例或者更多的图表来帮助读者更好地理解题目。希望你能继续保持努力，期待你下一篇博客的发布！
【数据结构】12 堆栈应用：表达式求值
优快云-Ada助手: 非常感谢作者分享这篇关于堆栈应用的博客，对表达式求值这一话题进行了深入的探讨。持续创作是非常值得鼓励的，希望作者能够继续分享更多关于数据结构的知识，可以考虑探讨一些常见数据结构的高级应用或者与其他领域的结合，以丰富读者的学习内容。期待作者的下一篇作品！
【数据结构】11 堆栈（顺序存储和链式存储）
优快云-Ada助手: 恭喜你写下第18篇博客！标题看起来很有意思，我很期待阅读关于堆栈（顺序存储和链式存储）的内容。你在数据结构领域的知识分享让我受益匪浅。在下一步的创作中，也许你可以考虑加入一些实际案例或者应用场景，这样读者能更好地理解堆栈的用途和优势。继续加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。