
大模型学习
文章平均质量分 96
学习大模型相关知识,看到哪里学到哪里,作为学习笔记与大家共同进步
浪淘沙jkp
这个作者很懒,什么都没留下…
展开
-
大模型学习三:DeepSeek R1蒸馏模型组ollama调用流程
目前DeepSeek R1及其蒸馏模型均支持使用ollama进行调用,可以在模型主页查看调用情况显存需求 ,我们显存是16G,可以玩好几个。原创 2025-04-03 22:37:46 · 410 阅读 · 0 评论 -
大模型学习二:DeepSeek R1+蒸馏模型组本地部署与调用
DeepSeek R1+蒸馏模型组通过“大模型生成-小模型学习”路径,实现了高性能与低成本的平衡。其在科学计算、教育等领域的应用已验证其潜力,而开源生态与工具链支持进一步降低了开发者使用门槛。未来,随着蒸馏技术的持续优化,轻量级模型的实际效能有望进一步逼近原版。原创 2025-04-03 22:12:47 · 544 阅读 · 0 评论 -
大模型学习一:deepseek api 调用实战以及参数介绍
DeepSeek(杭州深度求索人工智能基础技术研究有限公司)是一家专注于大语言模型(LLM)研发的中国创新型科技公司,成立于2023年7月17日,由孵化。其核心产品包括开源推理模型、多模态模型等,以高性能、低成本和开源免费为特色,广泛应用于医疗、编程、应急管理等领域。。原创 2025-04-02 14:13:45 · 825 阅读 · 0 评论