自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

hyzhyzhyz12345的博客

博客等级

码龄13年

12
原创

22
点赞

81
收藏

4
粉丝

关注

私信

热门文章

分类专栏

pytorch 2篇
ner 1篇
tensor与Tensor 1篇
拟合
elmo
词向量 2篇
transformer 2篇
GPT 1篇
attention 1篇
word2vec 1篇
概率图模型 1篇
序列标注问题 1篇

最新评论

说说transformer当中的维度变化
祖国翔: 输入decoder的mask通常是根据target_length来设定的。在Transformer模型中，解码器的self-attention mask会根据目标序列的长度来确定哪些位置是有效的，并且还会使用encoder-decoder attention mask来指示decoder在生成每个位置时应该关注哪些输入位置的信息。为了保证encoder的输出维度与max(target_length)一致，通常会对输入序列进行填充（padding）以匹配最长目标序列的长度。这样，虽然不同样本的输入序列长度可能不同，但通过填充，每个输入序列都会被扩展到相同的长度，从而保证encoder的输出维度与最长的目标序列长度一致。在进行填充后，还需要使用attention mask来标记填充部分，以确保模型在计算注意力时不会考虑填充位置的信息。总之，通过填充输入序列，并使用适当的注意力mask，可以确保encoder的输出维度与最长的目标序列长度一致，从而保证模型能够正确处理不同长度的输入序列。欢迎关注！
说说transformer当中的维度变化
Wsyoneself: 想问一个细节：输入decoder的mask是根据encoder的输出来设定，还是根据target_length来设定？如果是根据target_length来设定，如何保证，encoder的输出维度与max(target_length)一致呢？
利用hugging face进行albert-lstm-crf的命名实体识别
学习吧少年: 请问： 1. ALBERT中的CLS在进入BILSTM前要不要手动去掉？ 2. 用Huggingface的tokenizer自动pad了数据，但是pytorch的LSTM需要Packed数据，这怎么处理呢？
说说transformer当中的维度变化
koala_cola: 总结的挺好
利用hugging face进行albert-lstm-crf的命名实体识别
澈马奔腾: 很好，对代码的注释很详细

transformer

关注

关注数：文章数：2 文章阅读量：13664 文章收藏量：59

作者: hyzhyzhyz12345

这个作者很懒，什么都没留下…

展开

专栏收录文章