Encoder-Decoder、Encoder only、Decoder only

特性Encoder-DecoderEncoder OnlyDecoder Only
架构区别编码器将输入序列(如源语言句子)转换为中间表示;解码器根据中间表示生成目标序列(如目标语言翻译)。专注于理解输入文本,通过自注意力机制捕捉输入的全局上下文信息。通过自回归方式(从左到右生成)或自注意力机制生成文本,同时处理输入和输出的依赖关系。
优势-灵活处理输入输出长度不一致的任务
-编码器与解码器可独立优化,适合需要明确输入-输出映射的场景
-深度理解语义,适合需要全局上下文分析的任务。 -训练效率高,适合预训练任务。- 强大的生成能力,适合需要创造性输出的任务。 - 自注意力机制可捕捉长距离依赖,生成连贯文本。
依赖范围依赖中间表示仅依赖输入序列的全局上下文生成内容依赖前部分给予和已生成内容
掩码机制Encoder随机掩码,Decoder遮掩后部分随机遮盖遮盖后部分进行自回归
适配任务适合序列到序列任务如:机器翻译、文本摘要、结构化数据生成适合深度语义理解任务如:文本分类、问答系统、预训练语言模型擅长开放域文本生成如:对话系统、代码生成、开放式问答
推理速度较慢
参数效率参数量较大中等可扩展至极大
相关模型Transformer、T5、BARTBERT、RoBERTaGPT系列、LLaMA、Qwen

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值