自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 大模型开发基础知识:自注意力机制和多头注意力机制及其代码实现

自注意力机制通过计算序列内部元素的关联权重,实现了对上下文信息的有效捕捉,解决了传统序列模型的诸多缺陷。而多头注意力机制则进一步通过多视角学习,增强了模型对复杂依赖关系的建模能力,成为了现代大模型架构中不可或缺的核心组件。在实际应用中,我们还可以对注意力机制进行各种优化和拓展,比如引入相对位置编码来增强位置信息的建模、采用稀疏注意力来提高计算效率等。深入理解和掌握自注意力机制与多头注意力机制,对于从事大模型开发和研究的人员来说至关重要,它们是打开大模型奥秘之门的一把关键钥匙。

2025-08-14 14:49:40 945

原创 python三大库:numpy,matplotlib,pandas

add_axes参数:数组[left,bottom,width,height],数组元素的取值范围:(0,1)a = np.array([1, 2, 3]) # 一维数组。b = np.array([[1, 2], [3, 4]]) # 二维数组。arr.sort() # 原地排序 [1, 2, 3]arr_2d[:, 1] # 所有行的第1列 ([2, 4])arr.sum(axis=0) # 沿列的求和 ([4, 6])

2025-04-07 11:27:02 1638

原创 AI250301罗旺3.8作业

python初学

2025-03-08 19:08:19 308

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除