编程AI新王Claude Opus 4.5正式发布！编程基准突破80.9%，成本降三分之二

原创于 2025-11-25 16:32:27 发布 · 314 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #Claude Opus 4.5 #AI编程 #Gemini 3 pro #算家计算 #算家云 #租算力，到算家云

话题文章专栏收录该内容

245 篇文章

订阅专栏

刚刚，AI编程领域再起波澜。

昨晚，Anthropic 旗下最强AI编程模型Claude Opus 4.5正式发布。作为Anthropic的最新力作，这款模型在多个核心维度实现了突破。

在编程能力方面，Claude Opus 4.5在SWE-bench Verified测试中达到80.9%的准确率，这一数据超越了包括Gemini 3 Pro在内的众多竞品。

在Anthropic内部针对工程师候选人的高难度测试中，该模型在两小时内的得分超过了所有人类参与者，展现出在技术执行和高压判断上的强劲实力。

除了核心性能的升级,新模型也在价格方面进行了调整。相较于前代产品，Claude Opus 4.5的定价大幅下调三分之二，每百万输入Token仅需5美元，输出Token为25美元，进入了更多开发者和企业的可接受范围。

效率优化方面，新增的effort参数允许用户在时间、成本与能力之间灵活平衡，中等努力水平下可减少76%的Token使用量，同时保持良好性能。

值得关注的还有新模型在长上下文处理上的进步。Opus 4.5引入了记忆改进机制，专门优化了长上下文操作的能力。

通过智能的内容压缩与内存管理技术，模型实现了名为“无限对话”的功能，有效突破了传统上下文窗口的限制，为用户提供了近乎无限的对话体验。

总体而言，新一代模型整体能力均优于前代模型，并在许多领域达到了当前 SOTA 水平。

与Gemini 3 Pro相比如何？

而最近掀起AI热潮的Gemini 3 Pro，则采用了稀疏混合专家架构，这种设计允许模型根据每个输入动态选择最相关的“专家”子网络，既提高了效率，又降低了成本。

性能表现上，Claude Opus 4.5在编程准确率和效率控制上更具优势，尤其在多语言代码编写、复杂Bug修复等场景中表现突出。

Gemini 3 Pro的突出优势体现在其完整的原生多模态支持上，能够统一处理文本、图像、音频、视频和代码，而非简单的后期融合。

定价策略上，Claude Opus 4.5以高性价比为核心，适合追求稳定输出和成本控制的用户；Gemini 3 Pro专业版定价偏高，更面向需要高级功能和精致创意输出的专业场景。

应用场景的分化进一步明确了各自的适用范围。前端开发中，Claude Opus 4.5擅长功能性网站搭建，Gemini 3 Pro则在视觉复杂性和互动设计上更胜一筹。

如果工作流程涉及大量多媒体内容处理，例如需要分析视频片段、理解图表信息或处理音频内容，Gemini 3 Pro的原生多模态能力可能更为适合。其完整的模态支持使得它在处理跨媒介任务时具有天然优势，能够更好地理解不同格式信息之间的关联。

而对于专注于纯代码生成和复杂软件工程任务的团队，Claude Opus 4.5可能是更合适的选择。

AI编程模型市场已形成多样化竞争格局，从国际巨头的闭源产品到国产高性价比方案，从开源可定制模型到垂直场景专用工具，不同产品各有侧重。

在选择AI编程模型时，大家应结合预算、使用场景、工具习惯和特殊需求综合判断，让AI工具真正适配自身的开发需求，才能最大化提升效率。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。