书生大模型实战闯关--第四关

书生大模型实战闯关–第四关

1. 书生·浦语大模型开源开放体系–开源一周年发展历程

(不只是InternLM模型,是整个开源体系)

在这里插入图片描述

在这里插入图片描述

2. 性能飞跃

在这里插入图片描述

2.1 领先其他同量级开源模型的推理能力

在这里插入图片描述

2.2 100万 Token 上下文(大海捞针实验)

在这里插入图片描述

大海捞针实验:给模型提供一段非常长的背景知识时,模型是否能完美地定位其中任何位置的任何信息。

思考:文档长度为900000时,分数甚至略高于文档长度为1000000时,说明文档长度是影响得分的重要因素,但不是唯一因素,可能文档内容中的逻辑关系或者字词的复杂度也会影响得分。

2.3 基于规划和搜索解决复杂问题

在这里插入图片描述

模拟人的解决思路

3. 核心技术思路(数据质量驱动模型性能)

最终还是数据质量驱动模型性能。

在这里插入图片描述

三种策略:

在这里插入图片描述

4. 书生·浦语开源模型谱系(涌现现象)

四个量级模型和三种模态:

在这里插入图片描述

涌现现象:20B的模型开始有涌现的现象,即没有见过的内容也能做出有效反馈。

5. 全链条开源生态总览图(全部开源了)

在这里插入图片描述

5.1 全链条开源开放体系–数据

在这里插入图片描述

5.2 全链条开源开放体系–开源数据处理工具箱

三种工具的功能介绍:

在这里插入图片描述

5.3 全链条开源开放体系–预训练 InternEvo

可以降低硬件要求和提高效率。

在这里插入图片描述

5.3 全链条开源开放体系–微调 XTuner

在这里插入图片描述

XTuner的一些评测:

在这里插入图片描述

5.4 全链条开源开放体系–OpenCompass 评测体系

在这里插入图片描述

在这里插入图片描述

5.5 全链条开源开放体系–部署 LMDeploy

在这里插入图片描述

5.5 全链条开源开放体系–智能体

在这里插入图片描述

Lagent 智能体:

在这里插入图片描述

MindSearch 智能体:

在这里插入图片描述

右边会显示思路,可视化展现思维路径。

6. HuixiangDou–企业级知识库构建工具

在这里插入图片描述

HuixiangDou的特性:

在这里插入图片描述

总结:

本次闯关,了解了书生·浦语大模型开源开放体系开源一周年的发展历程;以及书生·浦语大模型性能飞跃的三个方面;核心技术思路:数据质量驱动模型性能;认识了书生·浦语开源模型谱系的四个量级模型和三种模态,明白了什么是涌现现象;认识了全链条开源开放体系各个环节以及工具;了解了HuixiangDou的基本信息和特性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值