DeepSeek高调宣布,DeepSeek R1 0528重磅升级,硬刚Claude 4、Gemini 2.5 Pro

在这里插入图片描述

5月28日,DeepSeek官方发布了R1模型 SinaIthome的小版本升级,当前版本为DeepSeek-R1-0528

在这里插入图片描述

一、核心改进

1、思考更深,推理更强

DeepSeek-R1-0528仍然使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力

在这里插入图片描述

2、数学推理能力显著增强

在AIME 2025测试中,新版模型准确率由旧版的70%提升至87.5%。

在AIME 2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。

在这里插入图片描述

3、整体水平接近国际顶尖模型

更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

二、具体功能改进

1、幻觉问题大幅改善

新版DeepSeek R1针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右。

2、创意写作能力增强

在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

3、新增工具调用功能

DeepSeek-R1-0528支持工具调用(不支持在thinking中进行工具调用)。当前模型Tau-Bench测评成绩为airline 53.5% / retail 63.9%,与OpenAI o1-high相当。

4、前端开发和角色扮演

DeepSeek-R1-0528在前端代码生成、角色扮演等领域的能力均有更新和提升。

三、使用方式

免费体验:通过DeepSeek官网、APP或小程序,即可体验。

API调用:API费用为每100万输入tokens $0.14(非高峰时段$0.035),输出tokens $2.19。

这次0528版本的更新可以说是“小更新,大提升”。

虽然基础架构没变,但通过投入更多算力进行后训练,让模型在推理深度、准确性和实用性方面都有了质的飞跃,特别是在数学推理方面的表现已经接近国际顶尖水平,而且还解决了AI模型常见的"胡说八道"问题,让结果更可靠。

通过DeepSeek官网,没用几次,又“网络异常,请稍后充实”了,真实蛋疼。

在这里插入图片描述

解决服务器繁忙问题

为了让小伙伴们能第一时间流畅使用最新版DeepSeek-R1-0528,告别“服务器繁忙,请稍后重试”的问题。

吒哥已经将DeepSeek-R1-0528集成到了AI系统。

在这里插入图片描述
使用地址:www.nezhasoft.cloud

私信哪吒,可以试用三天,上面所有模型可用。

还包含了ChatGPT4o(支持原生文生图,不降智)、o4-mini(支持Deep Research深入研究)、o4-mini-high、o3、Claude Sonnet 4、GPT4.5、GPT4.1、Gemini 2.5 Pro Preview 0506、Grok3 thinking等模型。

四、真实评测

1、绘制svg图片

你是Java领域的专家,请为“Java全栈工程师”生成一张完整的SVG图片,要求如下:
1、图片样式:技术路线图
2、风格定位:卡通风格
3、颜色方案:暖色系
4、按照技术的前后端、由易到难,分别展示
5、要求层次清晰,图片美观

在这里插入图片描述

在这里插入图片描述

Claude Sonnet 4 绘制svg图片:

在这里插入图片描述

DeepSeek R1 0528在SVG生成中不仅实现了美观的卡通风格设计,更通过动态效果、层次化配色和复用结构显著提升了技术路线图的可读性和表现力,特别适合用于技术学习路径的可视化展示。

但相较于Claude Sonnet 4,还有很长一段路要走。

2、小球弹跳测试

Arena-Hard小球弹跳测试,它用于评估大模型在推理、计算、代码等多个方面的综合能力。

使用 p5.js创建 12 个彩色球在三个旋转的嵌套的分别有一个缺口的六边形内弹跳的效果,旋转速度较快,考虑重力,弹性,摩擦和碰撞,符合物理自然规律。

在这里插入图片描述

在这里插入图片描述

效果展示:

在这里插入图片描述

3、小游戏

通过html写一个俄罗斯方块游戏

在这里插入图片描述
在这里插入图片描述

效果展示:

在这里插入图片描述

生成的俄罗斯方块游戏代码超过了1000行,包含完整游戏逻辑、UI界面、状态管理、用户交互等全部核心模块。

游戏功能全面,包括:方块生成与旋转、消除计分、难度升级、下一个方块预览、键盘/按钮控制、游戏状态管理(开始/暂停/重置)等。

且能正常、流畅运行。

晋升编程大模型T0梯队,编程能力完全可以媲美GPT4.1、Claude Sonnet 4、Gemini 2.5 Pro Preview 0506。

解决服务器繁忙问题

为了让小伙伴们能第一时间流畅使用最新版DeepSeek-R1-0528,告别“服务器繁忙,请稍后重试”的问题。

吒哥已经将DeepSeek-R1-0528集成到了AI系统。

在这里插入图片描述
使用地址:www.nezhasoft.cloud

私信哪吒,可以试用三天,上面所有模型可用。

还包含了ChatGPT4o(支持原生文生图,不降智)、o4-mini(支持Deep Research深入研究)、o4-mini-high、o3、Claude Sonnet 4、GPT4.5、GPT4.1、Gemini 2.5 Pro Preview 0506、Grok3 thinking等模型。

### ZooKeeper备份与恢复工具推荐 对于ZooKeeper的备份与恢复需求,以下是几种常见的解决方案及其特点: #### 1. **Python脚本工具 (TiZkBackupRestore)** 该工具由用户提供并托管于GitHub仓库 `https://github.com/idealage/TiZkBackupRestore`[^1]。它支持以下功能: - 数据备份:可将指定路径下的所有节点(包括子节点)导出为XML文件。 - 数据恢复:能够从XML文件中读取数据并将之还原到目标路径。 - 权限备份:支持Digest认证方式的权限信息备份与恢复(其他模式尚未验证)。 此工具适用于单机环境或伪集群场景,尤其适合需要保留权限信息的情况。 #### 2. **Java实现的备份与恢复工具** 根据引用描述[^2],可以采用纯Java代码的方式实现持久化节点的数据备份与恢复操作。这种方式的优点在于完全控制逻辑流程,并能灵活适配特定业务需求。然而,这种方法不涉及权限信息的处理,仅关注数据层面的操作。 示例代码片段如下: ```java import org.apache.zookeeper.ZooKeeper; import java.io.File; public class ZKBackup { public static void main(String[] args) throws Exception { String connectString = "localhost:2181"; int sessionTimeout = 3000; try (ZooKeeper zk = new ZooKeeper(connectString, sessionTimeout, event -> {})) { // 实现具体的备份逻辑... } } } ``` #### 3. **基于zk-shell的备份恢复脚本** 通过命令行工具`zk-shell`编写Shell脚本来完成自动化备份工作[^4]。这种方案简单易用,特别适合熟悉Linux Shell编程的技术人员。其核心思路是从远程ZooKeeper实例拉取所需路径的内容保存成JSON格式文件存档;后续可通过逆向过程重新加载这些档案回原位置或其他地方。 优点包括但不限于快速部署、无需额外依赖库安装等特性。缺点则是缺乏图形界面交互体验以及可能存在的性能瓶颈问题,在大规模生产环境中需谨慎评估适用性。 #### 4. **官方推荐方法——Export/Import API** Apache官方文档提到利用客户端API接口手动执行export/import动作来达到目的[^not_provided]。虽然没有具体提及某个独立第三方产品名称,但强调了程序设计者可以根据实际状况定制专属解决办法。 --- ### 总结对比表 | 特性 | Python Script | Java Code | zk-shell Script | Official Export/Import | |---------------------|--------------------|--------------------|--------------------|------------------------| | 开发语言 | Python | Java | Bash | Any | | 是否支持权限 | 是 | 否 | 否 | 取决于实现细节 | | 配置复杂度 | 中等 | 较高 | 低 | 高 | | 社区活跃程度 | 小众开源项目 | 广泛应用 | 常见运维实践 | 官方标准 | 综上所述,如果当前环境下存在特殊的安全考量比如ACL规则同步,则优先选用已有的成熟框架如前述Python版实用工具;反之则可根据团队技术栈倾向挑选更适合的语言构建自定义组件或者沿用简便快捷的传统手段如shell脚本形式达成目标。 ---
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

哪 吒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值