python简单实现注意力机制

最新推荐文章于 2025-08-24 03:48:50 发布

原创最新推荐文章于 2025-08-24 03:48:50 发布 · 5.2k 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #自然语言处理

深度学习经验总结专栏收录该内容

20 篇文章

订阅专栏

博客涉及深度学习和自然语言处理领域。深度学习是数据挖掘重要手段，自然语言处理可进行词法、句法等分析。二者在信息技术中应用广泛，能助力文本处理、语义理解等工作。

部署运行你感兴趣的模型镜像

import numpy as np
import torch.nn as nn
from sklearn.metrics.pairwise import cosine_similarity

softmax = nn.Softmax()

#设置查询向量和待查询向量
q = np.array([[1,2,3]])#使用cosine_similarity函数必须为二维向量
v = np.array([[1,2,3],[4,5,6]])

#计算q和v中每个向量之间的attention得分，此处使用余弦相似度计算，可以采取其他多种计算方式
sim = cosine_similarity(q,v)

#对计算得到的attention得分进行softmax归一化
softmax_sim = softmax(torch.tensor(sim[0]))

#依据attention对v中的每一个向量进行加权求和
attention = 0
for i in range(v.shape[0]):
	attention += v[i] * np.array(softmax_sim[i])

#加权求和后取平均
attention = attention / v.shape[0]

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.9

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。它提供了一个灵活的平台,用于构建和训练各种机器学习模型

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

嘿，兄弟，好久不见

关注关注

4
点赞
踩
22

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用Python实现深度学习模型：注意力机制（Attention）

Echo_Wish

05-23

1513

注意力机制最初是为了解决机器翻译中的长距离依赖问题而提出的。其核心思想是：在处理输入序列时，模型可以动态地为每个输入元素分配不同的重要性权重，使得模型能够更加关注与当前任务相关的信息。在本文中，我们介绍了注意力机制的基本原理，并使用 Python 和 TensorFlow/Keras 实现了一个简单的注意力机制模型应用于文本分类任务。希望这篇教程能帮助你理解注意力机制的基本概念和实现方法！

使用Python实现大语言模型中的自注意力机制

二进制的梦想

01-07

1480

自注意力机制主要用于处理序列数据，允许模型在每个时间步上对整个输入序列的所有其他部分进行注意。与传统的序列处理模型不同，自注意力机制无需顺序处理整个序列，因而能够实现更高的并行化。自注意力机制是大语言模型的核心组件，它极大地提高了模型对自然语言的理解和生成能力。通过Python实现自注意力机制，我们可以更深入地理解其工作原理和应用场景。未来，随着技术的不断发展，自注意力机制将进一步优化，为自然语言处理领域带来更多创新。

3 条评论您还未登录，请先登录后发表或查看评论

3 条评论

春困夏乏冬无力 2021.05.24
这是自注意力吗？
- 春困夏乏冬无力回复嘿，兄弟，好久不见 2021.05.24
  好的，谢谢ヽ(✿ﾟ▽ﾟ)ノ
- 嘿，兄弟，好久不见回复春困夏乏冬无力 2021.05.24
  不是，只是最初版本的注意力机制，自注意力请参考：https://blog.youkuaiyun.com/longxinchen_ml/article/details/86533005