就在端午节前,DeepSeek 以其一贯的低调风格,发布了 R1 模型的最新版本:DeepSeek-R1-0528。这款拥有惊人 6850 亿参数、支持 BF16 精度的庞然大物,目前已正式登陆HuggingFace,吸引了全球AI从业者的目光。
本次 DeepSeek-R1 的升级可谓是全方位的进化。据悉,新模型在语义理解的精准性、复杂逻辑的推理能力以及长文本处理的稳定性等方面都得到了显著的强化。
核心更新亮点抢先看:
- 媲美谷歌模型的深度推理: DeepSeek-R1-0528 被认为在深度推理能力上已经可以与顶尖的谷歌模型相媲美,这意味着它在处理复杂任务时将更加得心应手。
- 更优化的文本生成: 新模型在文本生成方面进行了精细的调优,不仅内容更加自然流畅,格式也更加规范美观,极大地提升了用户体验。
- 独特且强大的推理风格: DeepSeek-R1-0528 的推理速度快且逻辑缜密,展现出独特的风格,能够高效地完成各种复杂的推理任务。
- 支持更长时间的思考: 令人印象深刻的是,DeepSeek-R1-0528 单任务的处理时长可以达到 30-60 分钟,这为处理更复杂的、需要长时间思考的任务提供了强大的支持。
其他能力更新
- 幻觉改善: 新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供更为准确、可靠的结果
- 创意写作: 在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。
更令人信服的是,AI 科技博主「karminski-牙医」通过实际测试对比了 DeepSeek-R1-0528 和 Claude 4 Sonnet。结果显示,无论是对光线漫反射的理解,还是对物体运动轨迹的预测,亦或是用户界面的美观程度,DeepSeek-R1-0528 都展现出了明显的优势。
值得一提的是,这已经是 DeepSeek 自 3 月底以来又一次重要的技术更新。在 3 月 25 日,DeepSeek 还发布了 V3 模型的小版本升级(DeepSeek-V3-0324),针对推理、前端开发、中文写作和中文搜索等多个关键领域进行了优化。这一系列的动作充分展示了 DeepSeek 在 AI 技术领域的持续创新和快速迭代能力。
对于想要亲身体验这款强大模型魅力的开发者来说,现在可以通过一些便捷的本地开发环境,例如 ServBay,轻松集成 Ollama,快速下载并部署 DeepSeek-R1-0528,从而在本地环境中探索其卓越的性能。
DeepSeek-R1-0528 的发布无疑为我们打开了通往更智能未来的大门,而借助 ServBay 等工具,开发者可以更便捷地拥抱这场技术革新。