YuLan: An Open-source Large Language Model

本文是LLM系列文章,针对《YuLan: An Open-source Large Language Model》的翻译。

摘要

大型语言模型(LLM)已经成为许多应用程序的基础,利用其在处理和理解自然语言方面的广泛能力。虽然许多开源LLM都发布了技术报告,但缺乏训练细节阻碍了进一步的研究和开发。本文介绍了YuLan的开发,这是一系列具有120亿参数的开源LLM。YuLan的基本模型是在来自不同语料库的大约1.7Ttoken上预训练的,这些语料库包括大量的英语、汉语和多语言文本。我们设计了一个三阶段的预训练方法,以提高玉兰的整体能力。随后的训练阶段包括指令调整和人员调整,使用大量高质量的综合数据。为了促进复杂和长尾知识的学习,我们设计了一个贯穿这些阶段的课程学习框架,帮助LLM以从易到难的方式学习知识。玉兰的训练将于2024年1月结束,在各种英语和汉语基准中取得了与最先进的LLM不相上下的成绩。本文概述了从头开始开发LLM的全面技术路线图。我们的模型和代码可在https://github.com/RUC-GSAI/YuLan-Chat

1 引言

2 模型架构

3 预训练

4 监督微调和

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值