Transformer

定义

一种基于自注意力机制的深度学习架构

整体架构

Transformer主要由编码器(Encoder)和解码器(Decoder)组成,两者都是由多个相同的层(Layer)堆叠而成。对于机器翻译任务,编码器接收源语言序列作为输入,将其转换为上下文表示,然后解码器利用这些上下文表示生成目标语言序列。
举例子
编码层的处理
在这里插入图片描述在这里插入图片描述
解码器的工作过程
在这里插入图片描述在这里插入图片描述
通过编码器和解码器的协同工作,Transformer能够将源语言序列“Hello, how are you?”准确地翻译成目标语言序列“你好吗?”。在整个过程中,编码器负责提取源语言序列的上下文信息,解码器利用这些上下文信息生成符合目标语言语法和语义的序列。

学习文章
https://www.zhihu.com/tardis/zm/art/600773858

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值