自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 探秘Transformer系列之(17)--- RoPE

RoPE编码来自苏神的工作Roformer, 它是目前LLM中广受欢迎使用的PE编码方式之一。Transformer论文使用了Sinusoidal位置编码,其是加性编码,即词嵌入与编码位置相加。每个位置的嵌入向量是固定的,不考虑其与其他位置的关系。Sinusoidal位置编码希望引入相对位置关系(任意位置的位置编码都可以表达为一个已知位置的位置编码的关于距离的线性组合),但不是很成功,模型只能在一定程度上感知相对位置。位置编码常见的改进思路是以三角式位置编码公式为基础,调整自注意力计算偏置。

2025-05-16 11:43:47 202

转载 使用双向 @OneToOne 注解避免 Spring Boot 中的 StackOverflowError

使用双向 @OneToOne 注解避免 Spring Boot 中的 StackOverflowError在使用 Java Spring Boot 开发过程中,实体之间的关系映射是一个非常常见的需求。为了便于理解,我们将介绍双向 @OneToOne 关系映射,以及如何避免由此产生的 StackOverflowError 问...

2024-08-20 04:09:26 322

转载 java强转成接口类型

Java强转成接口类型在Java编程中,我们经常会遇到需要将一个对象强制转换为接口类型的情况。这种转换通常发生在我们不确定对象具体类型,但知道它实现了某个接口的情况下。本文将通过代码示例和流程图,详细解释Java中如何进行强转成接口类型。什么是接口在Java中,接口是一种引用类型,它定义了一组抽象方法,这些方法可以被...

2024-07-20 03:03:55 261

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除