
Transformer
文章平均质量分 90
AliceWanderAI
北邮自动化学院,研究方向:图像处理,机器学习
展开
-
Switch Transformer模型解读-Introduction
论文相关资料论文 Switch Transformer: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity下载地址https://arxiv.org/pdf/2101.03961.pdf github 代码:https://github.com/tensorflow/mesh/blob/master/mesh_tensorflow/transformer/moe.py论文解读Introduction原创 2021-01-23 22:26:09 · 1371 阅读 · 0 评论 -
Transformer & BERT 详解第1篇(共4篇)
本系列文章围绕以下几个主题来详细解读Transformer和BERT的原理和发展Transformer 模型详解 Transformer在CV,NLP,推荐系统的发展与应用 BERT模型详解 BERT最新发展与应用本篇文章:Transformer模型详解整体结构 Encoder Decoder Positional Encoding Self Attention Add & Norm1. 整体结构Transformer主要由两大部分组成:Encoder &.原创 2021-01-15 22:29:07 · 882 阅读 · 0 评论