Decoder:
Decoder输入是一个one hot向量,比如英文可能是所有单词其中的一个单词,中文就是所有字里面的一个字。
每一次的输入,都是前一次的输出。这与encoder不一样,encoder的输入可能是一段话,然后分开成token,输入进去。但是decoder我们给的输入只有begin,后续decoder的输入都基于前面的输出
transformer
于 2025-03-11 22:38:55 首次发布
Decoder:
Decoder输入是一个one hot向量,比如英文可能是所有单词其中的一个单词,中文就是所有字里面的一个字。
每一次的输入,都是前一次的输出。这与encoder不一样,encoder的输入可能是一段话,然后分开成token,输入进去。但是decoder我们给的输入只有begin,后续decoder的输入都基于前面的输出