关于书生·浦语大模型全链路开源体系的笔记

在当今时代下,AI与大模型称为时代热门话题。

从当下图标中我们可以看出大模型的发展趋势。

当前,大模型已经成为发展通用人工智能的重要途经,它也逐渐从专业模型转变成通用模型。

下面是书生·浦语大模型的发展历程

书生·浦语大模型的分类

它可以分为轻量级、中量级、重量级三类,下面将详细介绍这三类模型各自的特点。

从上图我们可以看出,轻量级模型是社区低成本可用最佳模型规模,而中量级模型是商业场景可开发定制高精度,它是较小模型规模,重量级模型适用大语言模型能力全面覆盖,它是千亿模型规模。

书生·浦语20B开源大模型的性能比较

从模型到应用

我们需要知道,一个大语言模型无法做到直接应用到当前的生活场景中,例如:智能客服、个人助手、行业应用。他需要经过以下步骤。

书生·浦语全链路开源开放体系

数据

他的成长也是十分迅速的,当前,模态30+,数据集5400+,数据大小80TB+。

预训练

微调

在大语言模型的下游应用中,增量续训和有监督微调是经常会用到的两种方式。

增量续训

使用场景:让基座模型学习到一些新知识,如某个垂类领域知识

训练数据:文章、书籍、代码等

有监督微调

使用场景:让模型学会理解和遵循各种指令,或者注入少量领域知识

训练数据:高质量的对话、问答数据

评测

基于当前大模型的发展趋势,书生·浦语提出OpenCompass开源评测体系,下面是他在各个领域的应用与优点。

OpenCompass开源评测体系的架构

他还有丰富的模型支持

部署

为了解决大语言模型部署的一些挑战,提出了LMDeploy设计框架。

LMDeploy设计框架

提供大模型在GPU上部署的全流程解决方案,包括模型轻量化、推理和服务。

领先的推理性能

智能体

该项目可参考的原链接:书生·浦语大模型全链路开源体系_哔哩哔哩_bilibili

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值