QWEN TECHNICAL REPORT

本文是LLM系列文章,针对《QWEN TECHNICAL REPORT》的翻译。

摘要

大型语言模型(LLM)彻底改变了人工智能领域,使以前被认为是人类独有的自然语言处理任务成为可能。在本书中,我们将介绍QWEN,这是我们大型语言模型系列的第一部分。QWEN是一个全面的语言模型系列,包含具有不同参数计数的不同模型。它包括QWEN(基础预训练语言模型)和QWEN-CHAT(使用人类对齐技术微调的聊天模型)。基础语言模型在众多下游任务中始终表现出卓越的性能,聊天模型,特别是那些使用人类反馈强化学习(RLHF)训练的聊天模型,具有很强的竞争力。聊天模型具有创建代理应用程序的高级工具使用和规划功能,即使与使用代码解释器等复杂任务的大型模型相比,也展现出令人印象深刻的性能。此外,我们还开发了编码专用模型CODE-QWEN和CODE-QWEN-CHAT,以及基于基础语言模型构建的数学模型MATH-QWEN-CHAT。与开源模型相比,这些模型的性能显著提高,略落后于专有模型。

1 引言

2 预训练

2.1 数据

2.2 Tokenizati

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值