
随意线索:指有意识去关注的点

根据查询去寻找比较感兴趣的东西

K:衡量x和xi之间距离的一个函数。一除就拿到每一项的相对重要性,然后加权求和。

参数化,加入一个可以学习的参数。



好处:key和query可以是任意长度
注意力分数是没有被normalize过的
本文探讨了如何利用参数化的关键函数K衡量输入(x)与元素(xi)间的相似性,通过注意力机制赋予不同部分权重。该方法适用于任意长度数据,强调了其在信息检索和权重聚合上的优势,特别是在关键参数学习下的灵活性。

随意线索:指有意识去关注的点

根据查询去寻找比较感兴趣的东西

K:衡量x和xi之间距离的一个函数。一除就拿到每一项的相对重要性,然后加权求和。

参数化,加入一个可以学习的参数。



好处:key和query可以是任意长度
注意力分数是没有被normalize过的
1887
1万+

被折叠的 条评论
为什么被折叠?