RoPE(旋转式位置编码)

本文探讨了一种通过函数f()将绝对位置信息转化为相对位置信息的方法。首先,假设f()能够为q和k添加位置m,n的绝对信息。接着,通过内积保持相对位置信息的恒等式,推导出f()的表达式。在二维场景中,利用复数的性质解决此问题,并计划扩展到更高维度。此外,文中还提供了另一种理解该方法的视角。" 117164804,7971207,哈希与尺取法解决单词背诵问题,"['哈希算法', '算法', '数据结构']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

出发点:“通过绝对位置编码的方式实现相对位置编码”

操作步骤

1.假设一个函数f()通过他能让q,k带上绝对位置信息

对q,k进行操作(f())使得他们带上位置m,n的绝对位置信息,
在这里插入图片描述

通过内积后,希望结果带上相对位置信息,因此假设存在下列恒等关系
在这里插入图片描述

2.根据以上的恒等式求出f()

假设f(q,0)=q 和f(k,0)=k
先求出在二维情景下的情况,在推广到高纬度

借助复数来求解。在复数中有⟨q,k⟩=Re[qk∗],Re[] 代表复数的实部,所以我们有
在这里插入图片描述
简单起见,我们假设存在复数g(q,k,m−n),使得f(q,m)f∗(k,n)=g(q,k,m−n),然后我们用复数的指数形式,设

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值