多头自注意力机制

最新推荐文章于 2025-03-03 13:47:58 发布

代码小鬼才

最新推荐文章于 2025-03-03 13:47:58 发布

阅读量428

点赞数 4

文章标签：深度学习 pytorch python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_34171593/article/details/137117352

版权

import torch
import torch.nn.functional as F


class SelfAttention(torch.nn.Module):
    def __init__(self, embed_size, heads):
        super(SelfAttention, self).__init__()
        self.embed_size = embed_size
        self.heads = heads
        self.head_dim = embed_size // heads

        assert (
                self.head_dim * heads == embed_size
        ), "Embedding size needs to be divisible by heads"

        self.values = torch.nn.Linear(self.head_dim, self.head_dim, bias=False)
        self.keys = torch.nn.Linear(self.head_dim, self.head_dim, bias=False)
        self.queries = torch.nn.Linear(self.head_dim, self.head_dim, bias=False)
        self.fc_out = torch.nn.Linear(heads * self.head_dim, embed_size)

    def forward(self, values, keys, query, mask):
        N = query.shape[0]
        value_len, key_len, query_len = values.shape[1], keys.shape[1], query.shape[1]

        # Split the embedding into self.heads pieces
        values = values.reshape(N, value_len, self.heads, self.head_dim)
        keys = keys.reshape(N, key_len, self.heads, self.head_dim)
        query = query.reshape(N, query_len, self.heads, self.head_dim)

        values = self.values(values)
        keys = self.keys(keys)
        queries = self.queries(query)

        energy = torch.einsum("nqhd,nkhd->nhqk", [queries, keys])

        if mask is not None:
            energy = energy.masked_fill(mask == 0, float("-1e20"))

        attention = F.softmax(energy / (self.embed_size ** (1 / 2)), dim=3)

        out = torch.einsum("nhql,nlhd->nqhd", [attention, values]).reshape(N, query_len, self.heads * self.head_dim)

        out = self.fc_out(out)

        return out

代码小鬼才

博客等级

码龄9年

45
原创

265
点赞

292
收藏

226
粉丝

关注

私信

热门文章

分类专栏

随笔 7篇
工具 1篇
rasa 6篇
API接口调用 1篇

展开全部收起

最新评论

开源 Python 财务软件
代码小鬼才: 功能流程图 1、注册 1.1我是房东 1.1.1点击我是房东，展示列表，列表字段：设备编号、充电桩所属地。该列表支持增删改查，其中删除时，要再询问一遍是否删除防止误操作；房东绑定微信或支付宝。 1.2我是合伙人 1.2.1点击我是合伙人，展示列表，列表字段：设备编号、区域电费标准（元/度）。该列表支持增删改查，其中删除时，要再询问一遍是否删除防止误操作，合伙人绑定微信或支付宝 2、登陆 2.1我是房东 2.1.1点击我是房东，一级列表字段：设备编号、充电桩所属地。点击设备编号，进入下一步，展示历史提交列表，历史提交列表包含字段：提交凭证（电表照片）、标定度数、提交时间、点击查看凭证。新增按钮，需要提交的列表：提交凭证（电表照片）、标定度数、提交按钮。 2.2我是合伙人 2.1.1点击我是合伙人，一级列表字段：设备编号、充电桩所属地。点击设备编号，进入下一步，展示历史审核列表，历史审核列表（审核通过、驳回按钮失效）包含字段：提交凭证（电表照片）、标定度数、审核时间、点击查看凭证。合伙人不能新增，房东新增一条记录后，合伙人这里会新增一条记录，并有一个审核按钮和驳回按钮，点击审核通过、驳回，进入支付页面，支持支付宝、微信支付。整体逻辑，房东登录后，提交一条记录，根据充电桩唯一编号，将该列表发送给合伙人审核，合伙人审核通过后进入支付页面进行支付，支付时自动根据区域电费标准*（最新标定度数-上次标定度数）计算电费，并跳转微信或支付宝支付。合伙人发现提交凭证与标定度数不符时，点击驳回，驳回时需要备注驳回理由，房东收到驳回后重新上传凭证修改标定度数，重新提交，后续合伙人审核，直到审核通过，继续支付
LIDC-IDRI肺结节公开数据集
2301_79933825: 提取码错误呢
YOLO8分类任务-总结
2301_78181968: 请问有没有分类模型的网络结构图啊
rasa 略深层次理解
代码小鬼才: 你想在自定义动作中获取插槽类型吗
rasa 略深层次理解
内卷焦虑人士: 定义插槽的type怎么确定呢？文本的都是rasa.shared.core.slots.TextSlot，有自定义的都是categories？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。