详解TransformerEncoderLayer

算法精英攻城狮

已于 2024-03-05 21:13:56 修改

阅读量2.7k

点赞数 9

文章标签： python pytorch 神经网络 transformer

于 2024-03-05 20:59:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40727266/article/details/136489613

版权

nn.TransformerEncoderLayer 用于定义编码器中的一个层，它由多个子层组成，包括自注意力机制（self-attention）、前馈神经网络和残差连接（residual connection）等。

以下是 nn.TransformerEncoderLayer 类的主要参数和功能：

d_model (int) – the number of expected features in the input (required) 输入特征的维度大小
nhead(int) – the number of heads in the multiheadattention models (required). 自注意力机制中注意力头的数量，每个头对应一个不同的权重。
dim_feedforward(int) – the dimension of the feedforward network model (default=2048). 前馈神经网络中隐藏层的维度。
dropout (float) – the dropout value (default=0.1).用于控制模型的过拟合程度的 dropout 比例。

下面是一个示例使用 nn.TransformerEncoderLayer 创建编码器层的简单代码：

import torch
import torch.nn as nn

# 定义一个 Transformer 编码器层
encoder_layer= nn.TransformerEncoderLayer(d_model=512, nhead=8, dim_feedforward=2048)

# 创建输入张量
src = torch.rand((10, 32, 512))  # 输入序列的形状：(sequence length, batch size, feature size)

# 执行编码器层的正向传播计算
output = encoder_layer(src)

print(output.shape)  # 输出编码后的特征张量的形状

打印结果：torch.Size([10,32,512])

参考网址：TransformerEncoderLayer — PyTorch 2.2 documentation

算法精英攻城狮

博客等级

码龄8年

25
原创

183
点赞

212
收藏

130
粉丝

关注

私信

热门文章

上一篇：: Github镜像站点

下一篇：: RTC常用术语介绍

最新评论

VScode + libtorch配置
qq_38343011: 看见你的评论，我也想说眼瞎了
2025/26国际AI顶会介绍和链接——持续更新中
优快云-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
详解TransformerEncoderLayer
醉相思565: encoder层输入序列的形状：(sequence length, batch size, feature size)，这里的feature size就是d_model吗？可以告诉我为什么batch_size在第二个维度吗
VScode + libtorch配置
deep_thoughts: 这是nmm的linux配置，研瞎了
VScode + libtorch配置
优快云-Ada助手: 恭喜您写了第20篇博客！看到您分享关于VScode和libtorch的配置经验，让我受益匪浅。希望您能继续保持创作的热情和耐心，不断分享更多有价值的内容。下一步，也许可以考虑深入探讨一些高级应用场景或者结合实际案例进行分析，这样更能吸引读者的注意。期待您更多优质的文章，加油！

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。