在当今时代下,AI与大模型称为时代热门话题。
从当下图标中我们可以看出大模型的发展趋势。
当前,大模型已经成为发展通用人工智能的重要途经,它也逐渐从专业模型转变成通用模型。
下面是书生·浦语大模型的发展历程
书生·浦语大模型的分类
它可以分为轻量级、中量级、重量级三类,下面将详细介绍这三类模型各自的特点。
从上图我们可以看出,轻量级模型是社区低成本可用最佳模型规模,而中量级模型是商业场景可开发定制高精度,它是较小模型规模,重量级模型适用大语言模型能力全面覆盖,它是千亿模型规模。
书生·浦语20B开源大模型的性能比较
从模型到应用
我们需要知道,一个大语言模型无法做到直接应用到当前的生活场景中,例如:智能客服、个人助手、行业应用。他需要经过以下步骤。
书生·浦语全链路开源开放体系
数据
他的成长也是十分迅速的,当前,模态30+,数据集5400+,数据大小80TB+。
预训练
微调
在大语言模型的下游应用中,增量续训和有监督微调是经常会用到的两种方式。
增量续训
使用场景:让基座模型学习到一些新知识,如某个垂类领域知识
训练数据:文章、书籍、代码等
有监督微调
使用场景:让模型学会理解和遵循各种指令,或者注入少量领域知识
训练数据:高质量的对话、问答数据
评测
基于当前大模型的发展趋势,书生·浦语提出OpenCompass开源评测体系,下面是他在各个领域的应用与优点。
OpenCompass开源评测体系的架构
他还有丰富的模型支持
部署
为了解决大语言模型部署的一些挑战,提出了LMDeploy设计框架。
LMDeploy设计框架
提供大模型在GPU上部署的全流程解决方案,包括模型轻量化、推理和服务。
领先的推理性能
智能体
该项目可参考的原链接:书生·浦语大模型全链路开源体系_哔哩哔哩_bilibili