Transformer作用和RNN作用基本相同。原论文Attention is all you need中将Transformer结构用于NLP任务。Transformer相对于RNN的好处在于:
1、很大程度地解决了长期依赖问题。
2、可以并行地进行训练。
全文见:https://zhuanlan.zhihu.com/p/372777550
Transformer——作用、原理与结构
最新推荐文章于 2025-04-17 09:39:32 发布
Transformer作用和RNN作用基本相同。原论文Attention is all you need中将Transformer结构用于NLP任务。Transformer相对于RNN的好处在于:
1、很大程度地解决了长期依赖问题。
2、可以并行地进行训练。
全文见:https://zhuanlan.zhihu.com/p/372777550