自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 从核函数角度深度理解线性注意力Linear Attention

本文探讨了从映射函数到核函数在注意力机制中的应用,从核函数的角度分析了线性注意力机制。首先介绍了通过映射函数将低维数据升维以提高相似度计算精度的方法,随后引入核函数来简化高维相似度的直接计算。重点分析了注意力公式与核函数的关联,指出原始矩阵乘法计算复杂度高的问题,提出通过分解核函数为多个串行计算来降低复杂度。最后推导了近似计算方法,将原始公式转化为向量形式,并讨论了不同映射函数的设计选择。这些方法为优化注意力机制的计算效率提供了理论支持。

2025-12-19 19:26:58 305

原创 使用datasets库自定义数据集超详细讲解

【代码】使用datasets库自定义数据集超详细讲解。

2025-05-05 13:46:29 511

原创 CROHME数据集详解

注释"Closest Strk" 代表了与数学表达式中的符号或运算符最相关的笔迹,当处理 $x^{2M} + x^{M-1}$ 这个手写表达式时, "Closest Strk" 注释可以帮助系统准确地将每个笔迹与表达式中的变量、指数、加号等元素进行关联,对于最终得到正确的数学公式非常关键。重要的是type=true,表示这个注释记录了数学表达式的正确形式,$x^{2M}+x^{M-1}$表示公式的LaTeX格式。表示引用前面trace标记的id号为0的单条笔迹,在这里id为0和1的笔迹构成了x;

2024-04-27 18:20:04 1535

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除