理解Transformer的三层境界(待续...)
文章目录0x00、先导知识0.1 Seq2Seq0.2 Attention0x01.第一层境界高屋建瓴,会当凌绝顶总结0x02、第二层境界由浅入深,由表及里,渐入佳境宏观视角(A High-Level Look)将张量引入图片(Bringing The Tensors Into The Picture)开始“编码”(Now We’re Encoding! )从宏观视角看自注意力机制(Self-At...
原创
2019-04-25 15:56:53 ·
4662 阅读 ·
4 评论