自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 大模型开发基础知识之自注意力机制和多头注意力机制及其代码实现

自注意力机制(Self-Attention Mechanism ):找到自注意力机制通过引入概念来实现序列中各元素之间的信息交互和依赖建模。# 计算原始的注意力得分# 注意力得分归一化# 加权求和获取注意力后的结果多头注意力机制多头注意力机制的核心思想是,将注意力机制中的 Q、K、V 分成多个头,注意力结果,然后将所有头的输出拼接起来,最后通过一个线性变换得到最终的输出。# 随机生成自注意力机制的Query映射的权重矩阵# 随机生成自注意力机制的Key映射的权重矩阵。

2025-08-13 17:57:55 825

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除