作者:禅与计算机程序设计艺术 1.简介 Attention Is All You Need (A-Transformer)是一种全新的自注意力机制的网络结构,其特点在于将计算复杂度从O(N2)O(N^2)O(N