书生大模型全链路开源开放体系的笔记
参考视频
- InputLM2.5性能飞跃
- 推理能力提升20%
- 支持100万字上下文
- 自主规划和搜索完成复杂任务
- 迭代发展过程中的数据(质量)驱动模型性能
基于规则、模型和反馈的数据生成方法,以及如何使用开
源项目进行标注和推理。
- 基于模型的反馈数据生成方法,包括相似度对齐和基于反馈(标注数据)的强化训练。
- 大海捞针实验:给定一段超长文本,模型是否能够定位到任何位置的任何信息 (效果很好)
-
基于规划和搜索结局复杂问题的路径
-
全链路开源体系
-
微调框架XTuner(兼容性好)
-
部署LMDeploy
-
智能体框架