大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍3种常见的Transformer位置编码——正弦/余弦位置编码(sin/cos)、基于频率的二维位置编码(2D Frequency Embeddings)、旋转式位置编码(RoPE)
Transformer中常见的编码方式
- 自注意力机制(Self-Attention)本身不具备任何顺序或空间位置信息。
- 为此,需要显式地将位置信息嵌入输入特征,以确保模型能够感知特征间的空间或时间关系。
正弦/余弦位置编码(Sinusoidal Positional Encoding)
在 Transformer 的原始论文(Vaswani et al., 2017)中提出的,最原始的位置编码。正弦/余弦位置编码也叫1D Frequency Embeddings,通过频率函数将每个位置嵌入到特征空间中。
公式: