LLM 系列——Qwen2——论文解读

一、概述

1、是什么

    是单模态纯文本的大语言模型,论文全称《QWEN2 TECHNICAL REPORT》,开源了 一整套基础和指令调优的语言模型,参数范围从5亿到720亿不等,包括密集模型和混合专家模型。可以用于: 语言理解、生成、多语言、编码、数学和推理。

2、亮点

    主要是精召性能、数据和长文本处理方面,包括数据处理等使用了一些最新的其他论文的思路,模型结构等方面并没有大的改动,具体如下:
    * 旗舰模型Qwen2-72B在多个基准测试中表现出色,例如在MMLU、GPQA、HumanEval、GSM8K和BBH上得分均较高。
    *展现了强大的多语言能力,能够熟练处理约30种语言,凸显了其通用性和全球覆盖范围。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TigerZ*

你点滴支持,我持续创作,羞羞

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值