Attention Is All You Need论文阅读笔记
NIPS2017
1、Abstract &Introduction
目前主流的序列转换模型都是基于复杂的、带有encoder和decoder的CNN或者RNN。表现最好的模型也是在encoder和decoder的基础上接入attention机制所得的。作者提出了一种新型的简单的网络结构——the Transformer,该模型完全依靠attention机制,不依赖卷积和...
原创
2018-09-24 21:02:44 ·
483 阅读 ·
0 评论