
DeepSeek
文章平均质量分 64
第十人i
开发工程师
个人博客: http://www.start6.cn
github: http://www.github.com/EightDoor
码云: http://www.gitee.com/EightDoor
展开
-
大模型的 B是什么概念
大模型(例如 GPT、Llama、Claude 等)中的一般指的是,即这个数量级。参数数量决定了模型的容量和能力,但并不是唯一的衡量标准。大致来说,参数越多,模型的表达能力越强,能够处理更复杂的任务,但也会带来计算资源、训练难度等问题。所以,,需要根据应用场景来选择合适的大小。原创 2025-02-23 08:09:19 · 416 阅读 · 0 评论 -
DeepSeek-V3和DeepSeek-R1 有什么区别
DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek Inc.)开发的不同定位的模型,主要区别体现在技术目标、应用场景和功能特性上。原创 2025-02-23 08:08:03 · 1749 阅读 · 0 评论