DeepSeek大模型微调实践：从环境配置到参数优化

原创于 2025-11-20 10:35:33 发布 · 326 阅读

CC 4.0 BY-SA版权

部署运行你感兴趣的模型镜像

输入框输入如下内容

帮我开发一个心理医生对话系统，基于DeepSeek-7B模型进行微调，帮助有社交焦虑的人群获得专业心理建议。系统交互细节：1.用户输入心理困惑 2.系统以医生口吻给出专业回复 3.支持多轮对话 4.输出温和有同理心。注意事项：需使用EmoLLM心理健康数据集，采用LoRA微调方法控制显存占用。

示例图片

在InsCode(快马)平台上实践大模型微调有几个明显优势：

示例图片

对于想快速验证不同参数效果的开发者，平台提供的计算资源能大大缩短实验周期。我在测试不同学习率时，平台的一键运行功能让参数对比实验变得非常高效。

您可能感兴趣的与本文相关的镜像

Llama Factory

模型微调

LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考