L1-书生大模型全链路开源开放体系

学习视频链接:

1.书生·浦语大模型全链路开源体系_哔哩哔哩_bilibili

2.书生·浦语大模型全链路开源开放体系

一、大模型成为发展通用人工智能的重要途径

  1. 专用模型:针对特定任务,一个模型解决一个问题(初期)

  2. 通用大模型:一个模型应对多种任务、多种模态(近两年),如chatgpt

二、书生浦语大模型开源迭代

1、迭代历程

2、迭代核心技术思路

(1)模型迭代

(2)高质量合成数据

基于规则的数据构造

->对代码、公式、函数、数学解题等基于规则进行构造伪格式化(半格式化)

基于模型的数据扩充

->基于模型做数据扩充例如商业领域、计算领域等

给予反馈的数据生成

->基于人类反馈的强化训练,如满意度排序反馈进行数据生成

三、书生浦语大模型开源体系性能提升

四、书生浦语2.5技术亮点

1.推理能力领先(相较于internLM2.0推理性能提升20%)

2.支持100万字上下文(百万字长文理解和精确处理)

大海捞针实验:给模型提供海量背景知识,让模型定位文本中任何信息 

自主InternLM2.5的表现全绿

3.规划和搜索完成复杂任务(基于搜索引擎工具通过信息搜索和整合,针对复杂问题撰写专业回答)

五、书生浦语开源模型谱系 

六、书生浦语开源生态全链条

数据->预训练->微调->部署->评测->应用

1、数据

(1)开源数据处理工具箱 

2、预训练 InternEvo 

3、微调Xtuner

4、OpenCompass 评测体系

评测过程:工具-基准-榜单 三位一体

5、部署LMdeploy

6、应用

智能体框架Lagent

->智能体MInd Search

模拟人类思维逻辑可视化

 

 ->茴香豆

特性:

 

### 书生大模型 L1G1000 技术文档概述 书生大模型全链路开源体系提供了详尽的技术文档,涵盖了从基础架构搭建到具体应用场景实现的各个方面[^3]。该体系由上海人工智能实验室开发,旨在为用户提供全面的支持。 #### 主要组成部分 - **数据处理工具**:提供了一系列高效的数据预处理方法和技术,确保输入数据的质量和一致性。 - **技术栈**:包括但不限于自然语言处理(NLP),计算机视觉(CV)等领域所需的各种算法库和支持框架[^2]。 - **应用实例** - **MINSEARCH**: 基于AI驱动的搜索引擎解决方案,利用先进的检索技术和机器学习优化搜索体验。 - **RAG (Retrieval-Augmented Generation)**: 将传统的信息检索系统与现代的语言生成能力相结合,实现了更精准的内容理解和表达转换服务。 - **LabelLLM Project**: 提供了一套完整的自动化标签生成流程,极大地方便了NLP任务中的数据标注工作。 - **OpenCompass Platform**: 构建了一个公开透明的大规模评测环境,有助于推动整个行业的健康发展并提高模型评估的标准性。 ```python # 示例代码片段展示如何加载预训练好的BookSheng模型进行推理预测 from transformers import AutoModelForCausalLM, AutoTokenizer tokenizer = AutoTokenizer.from_pretrained("shanghaiai/booksheng-l1g1000") model = AutoModelForCausalLM.from_pretrained("shanghaiai/booksheng-l1g1000") input_text = "你好世界" inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(**inputs) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ``` 此段Python脚本展示了通过Hugging Face Transformers库快速上手使用书生大模型的方法之一。只需几行简单的命令即可完成对给定文本序列的编码解码操作,并获得相应的输出结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值