- 专用模型:针对特定任务,一个模型解决一个问题
- 通用大模型:一个模型应对多种任务、多种模态
书生浦语2.0(InternLM2)体系
面向不同的使用需求,每个规格包含三个模型版本:InternLM2-Base、InternLM2、InternLM2-Chat。均提供了7B和20B的版本。
从模型到应用
典型流程
全链条开放体系
- 数据:书生·万卷
- 预训练:InterLM-Train
- 微调:XTuner
- 部署:LMDeploy
- 评测:OpenCompass
- 应用:Lagent、AgentLego
微调
大模型的下游应用中,增量续训和有监督微调是两种常用方式。
- 增量续训:让基座模型学习到一些新知识,如某个垂直领域知识
- 有监督微调:让模型学会理解各种指令进行对话,或者注入少量领域知识。又分为全量参数微调和部分参数微调。