简介
大模型是发展通用人工智能的重要途径。从专用模型(AlphaGo、人脸识别、德州扑克等)到通用大模型,一个模型应对多个任务、多种模态。
书生-浦语大模型
书生-浦语大模型陆续推出:
- 2023.7.6,InternLM-7B:开源率先免费商用
- 2023.9.20,InternLM-20B:200亿参数,开源工具链全线升级
- 2024.1.17,InternLM2开源:性能超最新同量级开源模型
- 2024.7.4,InternLM2.5开源
书生-浦语2.5概览
- 推理能力领先
- 支持100万字上下文
- 自主规划和搜索完成复杂任务
从模型到应用
从模型到应用是一个长链条:模型选型-续训/全参数微调(算力足够)-部分参数微调(算力不足,如LoRA)-构建智能体(与外部系统进行交互)-模型评测-模型部署。
全链条开源体系
书生-浦语全链条开源体系:
- 数据:书生-万卷
- 训练框架:InternEvo
- 评测:OpenCompass
- 微调:XTuner
- 部署:LMDeploy
- 应用:Lagent、HuixiangDou、MindSearch、MindU
书生-万卷
50亿文档,1TB数据量
OpenDataLab 开放数据平台:30+模态,80TB数据