00 目前大模型介绍

1 大模型种类

        目前 主流的开源模型体系 分三种: 第一种: prefix Decoder 系 代表模型: ChatGLM 、ChatGLM2,第二种: causal Decoder 系 LLaMA-7B LLaMa 衍生物、Bloom,第三种:Encoder-Decoder 代表模型: T5 Flan-T5 BART ;
        prefix Decoder 和 causal Decoder Encoder-Decoder 区别是 attention mask 不同;

Encoder-Decoder
  1.  在输入上采用双向注意力,对问题的编码理解更充分
  2. 适用任务:在偏理解的 NLP 任务上效果好
  3. 缺点:在长文本生成任务上效果差,训练效率低;
causal Decoder
  1.   自回归语言模型,预训练和下游应用是完全一致的,严格遵守只有后面的token才能看到前面的 token的规则
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值