谁是最强编程大模型？横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

最新推荐文章于 2025-11-07 08:48:53 发布

原创最新推荐文章于 2025-11-07 08:48:53 发布 · 1.5k 阅读

·

23

·

CC 4.0 BY-SA版权

本文为博主原创文章，未经博主允许不得转载。

文章标签：

#gpt #GPT5 #Codex #claude #gemini #deepseek

搬砖工逆袭Java架构师专栏收录该内容

543 篇文章

订阅专栏

在这里插入图片描述

目录

先说结论：

编程能力：GPT-5 Codex > Claude Sonnet 4.5 > GPT-5 > Gemini 2.5 Pro

首先可以明确的是，四大模型给出的代码都没有bug，测试通过率都是100%，牛逼。

AI编程发展到如今这个程度，除了还需要人工配合外，其它的内容貌似都能干了。

程序员只负责使用AI辅助编程 + 抽烟摸鱼了。

GPT-5 Codex给出了解题思路与算法分析（包含问题本质、采用的数据结构和算法）、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明（包含边界用例）。

理由：

1、只有GPT-5 Codex对Java代码进行自测、给出了边界测试用例，小胜一筹。

2、Claude Sonnet 4.5作为Anthropic的最新旗舰模型，表现亮眼，但未给出边界测试用例，屈居第二。

3、GPT-5不是一次性完成，是通过多次连续提问，才给出了最后的答案，差评，但上下文较长，加分项。

4、Gemini 2.5 Pro没有明确表示对给出的代码进行自测、也未给出了边界测试用例。

国内直接使用GPT-5-Codex

谷歌浏览器访问：www.nezhasoft.cloud

私信哪吒，备注体验ai，领取体验码。

包含GPT-5、GPT-5 Thinking、GPT‑5 Codex、Sora2、Claude Sonnet 4.5、Gemini 2.5 Pro、Grok4、DeepSeek R1 0528等模型。

在这里插入图片描述

GPT-5 Codex

准确性：通过本地IDEA自测，通过率100%

GPT-5 Codex给出了解题思路与算法分析（包含问题本质、采用的数据结构和算法）、详细的Java 代码、详细的代码注释、对Java代码进行测试、测试用例及说明（包含边界用例）。

Claude Sonnet 4.5

准确性：通过本地IDEA自测，通过率100%

Claude Sonnet 4.5给出了解题思路与算法分析（包含问题本质、采用的数据结构和算法）、详细的Java 代码、详细的代码注释、测试用例及说明（不包含边界用例）。

GPT-5

准确性：通过本地IDEA自测，通过率100%

GPT-5给出了解题思路、算法步骤、详细的Java 代码、详细的代码注释、对Java代码进行自测、测试用例及说明（不包含边界用例）。

回答中没有明确表明：对Java代码测试用例自测。

Gemini 2.5 Pro

Gemini 2.5 Pro给出了解题思路与算法分析（包含问题本质、采用的数据结构和算法）、详细的Java 代码、详细的代码注释、测试用例及说明（不包含边界用例）。

往期精选

本地安装Codex，国内直接使用GPT-5-Codex

满血GPT-5上线，全方位提升，很强

重磅更新！Claude Sonnet 4.5发布，编程最强模型

谷歌高调宣布，Gemini 2.5 Pro重磅升级，硬刚Claude Sonnet 4，国内直接使用

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

哪吒 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。