文章目录
书生·浦语 2.5 概览
核心技术思路
模型迭代
数据合成
基于规划和搜索解决复杂问题
书生·浦语开源模型谱系
- 20 B 才开始出现明显的涌现能力
数据
开源数据处理工具箱
预训练 InternEvo
微调 XTuner
- 最低只需 8 GB 显存即可微调 7B 模型
OpenCompass 评测体系
工具 - 基准 - 榜单三位一体
部署 LMDeploy
智能体
LLM 的局限性:
- 最新信息和知识的获取:不可能每出现一个新的知识,就微调一次模型,成本太高了
- 回复的可靠性
- 数学计算
- 工具使用和交互
企业级知识库构建
参考文献
https://www.bilibili.com/video/BV1CkSUYGE1v/?vd_source=92ae20b037ffc8aceaab1e118f74a5cc