transformer中的嵌入位置编码的周期性

简单记录学习~

在 Transformer 的位置编码(Positional Encoding, PE)中,我们使用正弦和余弦函数来生成位置信息,其公式如下:

PE_{(pos, 2i)} = \sin\left(\frac{pos}{10000^{\frac{2i}{d_{\text{model}}}}}\right)

PE_{(pos, 2i+1)} = \cos\left(\frac{pos}{10000^{\frac{2i}{d_{\text{model}}}}}\right)

其中:

  • pos 表示序列中的位置(例如,第 0 个 token,第 1 个 token 等)。
  • i 表示嵌入维度的一部分索引(即,每个 token 的嵌入是一个 d_model 维的向量)。
  • dmodel​ 是嵌入维度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值