
大模型
文章平均质量分 75
程序猿学长
专注于产品研发团队管理 软件架构 微服务 中台 欢迎一起交流学习 MBA CTO PMP;关注微信公众号 程序猿学长,大量免费学习资源分享。程序猿学长
展开
-
完整的大模型微调代码(LLaMA 7B + LoRA)
这样你就可以成功微调 LLaMA 7B 并应用到特定领域了!以下是完整的 Python 代码,包括。如果有多个 GPU,可使用。原创 2025-03-10 12:01:08 · 509 阅读 · 0 评论 -
大模型研究:ChatGLM模型版本概述
ChatGLM系列目前有ChatGLM、ChatGLM2、ChatGLM3等多个版本,每个版本又有不同规模的模型,不同版本和规模在性能、应用场景等方面存在差异。原创 2025-02-08 22:08:49 · 1000 阅读 · 0 评论 -
大模型研究:DeepSeek三个版本(初级中级高级)资源要求说明
以下是DeepSeek - LLM 7B Chat、DeepSeek - V3、DeepSeek - LLM 6.7B 三个版本模型所需硬件资源的介绍:原创 2025-02-08 21:30:45 · 1944 阅读 · 0 评论