- 博客(10)
- 收藏
- 关注
原创 第四期书生大模型实战营 基础岛 第5关
对于 LoRA 或者 QLoRA 微调出来的模型其实并不是一个完整的模型,而是一个额外的层(Adapter),训练完的这个层最终还是要与原模型进行合并才能被正常的使用。对于全量微调的模型(full)其实是不需要进行整合这一步的,因为全量微调修改的是原模型的权重而非微调一个新的 Adapter ,因此是不需要进行模型整合的。,在使用前我们需要准备好三个路径,包括原模型的路径、训练好的 Adapter 层的(模型格式转换后的)路径以及最终保存的路径。表示合并后的模型最终的保存路径。然后,我们可以直接启动应用。
2024-11-23 22:27:09
1170
原创 第四期书生大模型实战营 基础岛 第1关
InternLM2.5与之前版本的模型性能有了质的飞跃。推理能力领先综合推理能力领先社区开源模型,相对于 InternLM2 性能提升 20%。支持 100 万字上下文支持百万字长文的理解和精确处理,性能处于开源模型前列。自主规划和搜索完成复杂任务通过信息搜索和整合,针对复杂问题提供专业回答,效率提升 60 倍。
2024-11-17 20:09:27
814
原创 第四期书生大模型实战营 基础岛 第3关
通过对比上述对话,可以明显发现,使用提示词后,大模型的回答的风格更加明显,回答更加精准,更加贴合用户需求。内容表达更加流畅,逻辑性也得到了显著提升,整体回答质量呈现出明显的优化。精心设计的提示词可以让大模型的回答更准确、更贴近需求,还能显得条理清晰、逻辑性更强。这说明在使用大模型的过程中,花点心思优化提示词,是非常值得的,效果会好得多。将不使用系统提示的书生浦语大模型作为 baseline 对比,提交的系统提示词要指导LLM表现出比baseline更高的性能,提供对比截图并加以分析说明即可。
2024-11-17 00:15:17
623
原创 第四期书生大模型实战营 基础岛 第2关
玩转书生「多模态对话」与「AI搜索」产品MindSearch开源的 AI 搜索引擎书生·浦语InternLM 开源模型官方的对话类产品书生·万象InternVL 开源的视觉语言模型官方的对话产品
2024-11-14 14:47:44
372
原创 第四期书生大模型实战营 入门岛 第1关
在WebIDE上 运行hello_world.py文件。在powershell上完成了SSH连接。使用 ssh 命令进行端口映射。最终WebUI界面效果。
2024-10-30 18:42:49
236
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅