
开源大语言模型-DeepSeek模型小试
文章平均质量分 97
在人工智能飞速发展的今天,DeepSeek 模型如何脱颖而出?本专栏将带你深入探索。一起踏上这场 DeepSeek 模型探索之旅,解锁 AI 潜力。
开源技术探险家
非计算机专业出身人士,但于2009年毅然投身IT行业。迄今,拥有15年的开发经验以及10年的项目管理经验。曾先后参与金融、政企、互联网等多个行业领域的数十个项目。对分布式架构、微服务技术以及大数据领域的知识掌握娴熟。当前,致力于人工智能(AI)方向的深入探索,所负责的项目已顺利完成大语言模型和算法的备案工作。
展开
-
开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(二)
DeepSeek-R1-Distill-Qwen-7B模型通过蒸馏技术成功提炼Qwen-7B核心知识,旨在满足小型模型需求,并在全面测试中优化性能和拓展应用边界。原创 2025-02-03 09:00:00 · 5768 阅读 · 15 评论 -
开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(一)
DeepSeek-R1-Distill-Qwen-7B模型通过蒸馏技术成功提炼Qwen-7B核心知识,旨在满足小型模型需求,并在全面测试中优化性能和拓展应用边界。原创 2025-02-02 18:05:27 · 18984 阅读 · 12 评论