AI编程霸主来了！谷歌升级Gemini 2.5 Pro，横扫编程榜，远超Claude 3.7 Sonnet

原创于 2025-05-07 18:02:20 发布 · 1.3k 阅读

·

11

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#AI编程 #Gemini 2.5 Pro #Google #Claude 3.7 #算家云 #人工智能 #租算力，到算家云

昨天，谷歌发布了 Gemini 2.5 Pro的升级版——Gemini 2.5 Pro Preview 05-06。这是一个特殊版本，也称为“I/O 版”，原定于几周后的 Google I/O大会上发布，但为了响应开发者的热情，谷歌选择提前发布。

新版本在编码能力方面有了显著的改进。尤其在前端和UI开发方面有所提升。它目前被评为编码能力最强的AI模型，并在LMArena编程排行榜上位列第一。

同时，它在WebDev Arena排行榜上排名第一：以显著优势远远领先于Claude 3.7 Sonnet。

要知道，即使是OpenAI的GPT-4o（“o3”）也无法击败 Claude 3.7 Sonnet。

Gemini 2.5 Pro Preview 05-06 的主要功能

1. 大幅提升前端/UI开发能力

Gemini 2.5 Pro Preview 05-06 提供了强大的功能，特别是对于 Web 前端开发。现在，用户可以从设计文件中获取精确的样式属性，如颜色、字体、填充、边距、边框等，并生成必要的CSS 代码。

【视频来源：Google官方演示】

开发人员不再需要手动实现这些视觉元素；使用Gemini 2.5 Pro Preview 作为 IDE，可以以现有应用程序的风格自动实现添加视频播放器等新功能。

2. 改进的代码转换和编辑功能

代码转换（修改代码以实现特定目标）和编辑功能也得到了极大改善。开发人员现在可以使用Gemini 2.5 Pro Preview 05-06 请求对其现有代码库进行更复杂的更改。

3. 提高函数调用的可靠性

针对上一版本用户的反馈，团队减少了函数调用中的错误，提高了调用触发率。这使得开发人员能够更可靠地生成代码。

4. 增强型代理式工作流程

增强了创建类似代理的工作流的能力，可以自主处理复杂任务。这使得开发人员更容易自动执行需要多个步骤的复杂任务。

5. 视频理解能力显著提高

Gemini 2.5 Pro Preview 具有尖端的视频理解能力，在 VideoMME 基准测试中得分高达 84.8%。将此功能与编码能力相结合，可以实现以前版本中无法实现的新工作流程。

最引人注目的新功能之一是“视频学习应用程序”。此功能在 Google AI Studio 中进行了演示，可通过单个 YouTube 视频创建交互式学习应用。理解视频内容并生成具有完整 UI 的学习应用程序的能力将成为教育内容创作者的革命性工具。

与上一版本对比（03-25）

根据WebDev Arena 排行榜，上一个版本 Gemini 2.5 Pro (03-25) 的得分为1273，而新版本的得分提高了147分。

开发人员可以通过Google AI Studio或Vertex AI的Gemini API访问 Gemini 2.5 Pro Preview。先前版本（03-25）的用户将自动路由到新版本（05-06），无需采取任何特殊操作。

除此之外，新版本的价格与之前版本相同。这对于开发人员来说是个好消息，因为这意味着尽管性能提高了，但价格却保持不变。

个人开发者可以通过Google AI Studio访问Gemini 2.5 Pro Preview。在AI Studio中，可以尝试不同的提示并通过API构建应用程序。

企业用户可以通过Vertex AI获取Gemini 2.5 Pro Preview。 Vertex AI 为大规模 API 请求和复杂工作流程提供了企业级解决方案。

对于消费者用户，可以通过Gemini应用程序访问Gemini 2.5 Pro Preview功能。 Canvas等功能尤其可以帮助您在单个提示中构建交互式 Web 应用程序。

该模型的更多功能和应用很有可能在Google I/O上推出，开发者社区对此抱有很高的期望。现有的 Gemini 2.5 Pro (03-25) 用户将自动获得新版本访问权限，无需任何额外设置，因此他们可以立即试用这些改进的功能。

随着AI技术的普及，未来的很多工作或许都将离不开AI工具，尤其对于广大开发者来说，一款好用的AI编程工具可以让项目达到事半功倍的效果。

Gemini 2.5 Pro Preview 05-06固然强大，但由于是闭源模型，高昂的收费对于AI初学者来说并不是性价比最高的选择，适用于对专业性要求较高的开发者。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。