大模型面试手撕代码题2——多头注意力机制

行走的小骆驼

已于 2024-11-01 16:12:39 修改

阅读量292

点赞数 2

CC 4.0 BY-SA版权

文章标签：深度学习人工智能机器学习

于 2024-11-01 16:12:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sdsasaAAS/article/details/143382700

讲解版：


# 自注意力机制函数attention 实现思路分析
# attention(query, key, value, mask=None, dropout=None)
# 1 求查询张量特征尺寸大小 d_k
# 2 求查询张量q的权重分布socres  q@k^T /math.sqrt(d_k)
# 形状[2,4,512] @ [2,512,4] --->[2,4,4]
# 3 是否对权重分布scores进行 scores.masked_fill(mask == 0, -1e9)
# 4 求查询张量q的权重分布 p_attn F.softmax()
# 5 是否对p_attn进行dropout if dropout is not None:
# 6 求查询张量q的注意力结果表示 [2,4,4]@[2,4,512] --->[2,4,512]
# 7 返回q的注意力结果表示 q的权重分布

def attention(query, key, value, mask=None, dropout=None):
    # query, key, value：代表注意力的三个输入张量
    # mask：代表掩码张量
    # dropout：传入的dropout实例化对象

    # 1 求查询张量特征尺寸大小
    d_k = query.size()[-1]

    # 2 求查询张量q的权重分布socres  q@k^T /math.sqrt(d_k)
    # [2,4,512] @ [2,512,4] --->[2,4,4]
    scores =  torch.matmul(query, key.transpose(-2, -1) ) / math.sqrt(d_k)

   # 3 是否对权重分布scores 进行 masked_fill
    if mask is not None:
        # 根据mask矩阵0的位置 对sorces矩阵对应位置进行掩码
        scores = scores.masked_fill(mask == 0, -1e9)

    # 4 求查询张量q的权重分布 softmax
    p_attn = F.softmax(scores, dim=-1)

    # 5 是否对p_attn进行dropout
    if dropout is not None:
        p_attn = dropout(p_attn)

    # 返回 查询张量q的注意力结果表示 bmm-matmul运算, 注意力查询张量q的权重分布p_attn
    # [2,4,4]*[2,4,512] --->[2,4,512]
    return torch.matmul(p_attn, value), p_attn


# 多头注意力机制类 MultiHeadedAttention 实现思路分析
# 1 init函数  (self, head, e

最低0.47元/天解锁文章

200万优质内容无限畅学

行走的小骆驼

博客等级

码龄5年

37
原创

327
点赞

281
收藏

210
粉丝

关注

私信

热门文章

分类专栏

SQL 2篇
LLM 3篇
深度学习 4篇
python 5篇
jupyter notebook 1篇
Excel 1篇

展开全部收起

上一篇：: 大模型面试手撕代码题1——梯度下降

最新评论

python中日志如何保存
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
用VLookup实现多个工作表格内同时查找
行走的小骆驼: 你好同学，用这个符号将他们连接起来就可以了：&
用VLookup实现多个工作表格内同时查找
2401_85214669: 大佬，想请教下如果在多个sheet中都有对应的数值，怎么把他们合并起来呢？
Window中的Git Bash工具
优快云-Ada助手: 恭喜您撰写了第10篇博客《Window中的Git Bash工具》，内容十分实用且详尽。希望您能继续保持创作的热情和努力，不断提升自己的写作水平。在下一篇博客中，或许可以分享一些关于Git Bash工具的高级技巧或者与其他开发工具的集成方法，这样能够吸引更多读者的关注。期待您的下一篇精彩文章！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

行走的小骆驼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。