导言
在上一篇文章位置编码(二) 介绍一维旋转位置编码(1D-RoPE)的公式,读者了解了一维的旋转位置编码。接下来,我们以苏剑林的文章为范本,讲解他是如何推导出旋转位置编码的。但在此之前,本文需要帮助读者补充一些数学基础知识,便于读懂原文。
苏剑林关于RoPE的文章,阅读顺序如下:
- 先阅读《让研究人员绞尽脑汁的Transformer位置编码》的"其他位置编码","融合式"一节
- 之后再阅读Transformer升级之路:2、博采众长的旋转式位置编码
- 然后,进阶到二维位置编码时,可阅读Transformer升级之路:4、二维位置的旋转式位置编码。
- 进一步的,可以阅读