Transformer代码学习

shushu113

于 2025-02-05 21:16:16 发布

阅读量932

点赞数 5

文章标签： transformer 学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_52793409/article/details/145459254

版权

在init函数里写需要用到的东西，如softmax、buffer；在forward里写怎么执行的，具体怎么做的

导入库

import numpy as np
import torch
from torch import nn
from einops import rearrange, repeat
from einops.layers.torch import Rearrange

求位置编码的类

思路：
给每个位置加上一个不同的偏置值，以此区别相同的词在不同位置上的不同含义，给输入带上位置信息。得到所有元素的位置编码表（是一系列预生成的东西，不是通过训练得到的）。

如何计算位置编码？----每个位置的x加上当前位置的偏置值
偏置值的计算：
相邻维度（偶数用正弦，奇数用余弦）共享同一频率，但相位不同，使模型能捕捉位置间的相对关系。分母 $10000^{2i/d_hid}$ 随着维度索引 i = hid_j//2 增大而指数级增长，导致位置编码的频率逐渐降低。（其中10000是经验值）
在这里插入图片描述

class PositionalEncoding(nn.Module):
	# d_hid（隐藏状态的维度）和 n_position（位置的数量）
    def __init__(self, d_hid, n_position=200):
    	super(PositionalEncoding, self).__init__() # 继承父类nn.Module
    	self.register_buffer('pos_table', self._get_sinusoid_encoding_table(n_position, d_hid))
    # 求所有输入元素位置编码表的方法
    def _get_sinusoid_encoding_table(self, n_position, d_hid)

最低0.47元/天解锁文章

博客等级

码龄5年

13
原创

56
点赞

94
收藏

27
粉丝

关注

私信

热门文章

上一篇：: 一些易忘的python语法

下一篇：: ViT(Vision Transformer)代码学习

最新评论

无密钥登录的操作过程（在两台Linux之间通信）
优快云-Ada助手: 推荐 CS入门技能树：https://edu.youkuaiyun.com/skill/gml?utm_source=AI_act_gml
计算机网络易错点总结
优快云-Ada助手: 恭喜你开始了博客创作！总结计算机网络易错点的文章对很多人都会有帮助。不过在下一篇博客中，也许可以加入一些实际案例或者个人经验，让读者更容易理解和接受。希望你能继续坚持写作，分享更多有价值的内容！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
考研政治易错知识点——马原理
优快云-Ada助手: 很高兴看到您分享了关于考研政治马原理的易错知识点总结，这对考研政治备考的同学们肯定会有很大的帮助。希望您能继续分享更多类似的知识点总结，让更多的人受益。另外，除了马原理的易错知识点，您也可以考虑分享一些对马克思主义基本原理的理解和应用，或者是一些历年考研政治真题的解析，这些内容也能够帮助同学们更好地备考。期待您更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
使用Git命令将本地文件上传到代码仓库
优快云-Ada助手: 恭喜你写了这篇关于使用Git命令上传文件的博客！你的文章对于初学者来说非常有用，清晰地介绍了如何使用Git命令来上传本地文件到代码仓库。接下来，我希望你可以考虑写一些关于如何解决常见的Git上传问题的文章，这将对读者非常有帮助。继续努力，期待你的下一篇文章！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
考研操作系统易错点总结
优快云-Ada助手: 恭喜您写了这么一篇有用的博客！对于考研操作系统的易错点总结，确实能够帮助到很多准备考研的同学。希望您能继续坚持创作，分享更多关于考研和学习的经验和心得。如果可能的话，可以考虑结合自己的学习经历，分享一些关于如何高效备考考研的经验，这对很多人会有所帮助的。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。