昨天,谷歌发布了 Gemini 2.5 Pro的升级版——Gemini 2.5 Pro Preview 05-06。这是一个特殊版本,也称为“I/O 版”,原定于几周后的 Google I/O大会上发布,但为了响应开发者的热情,谷歌选择提前发布。
新版本在编码能力方面有了显著的改进。尤其在前端和UI开发方面有所提升。它目前被评为编码能力最强的AI模型,并在LMArena编程排行榜上位列第一。
同时,它在WebDev Arena排行榜上排名第一:以显著优势远远领先于Claude 3.7 Sonnet。
要知道,即使是OpenAI的GPT-4o(“o3”)也无法击败 Claude 3.7 Sonnet。
Gemini 2.5 Pro Preview 05-06 的主要功能
1. 大幅提升前端/UI开发能力
Gemini 2.5 Pro Preview 05-06 提供了强大的功能,特别是对于 Web 前端开发。现在,用户可以从设计文件中获取精确的样式属性,如颜色、字体、填充、边距、边框等,并生成必要的CSS 代码。
【视频来源:Google官方演示】
开发人员不再需要手动实现这些视觉元素;使用Gemini 2.5 Pro Preview 作为 IDE,可以以现有应用程序的风格自动实现添加视频播放器等新功能。
2. 改进的代码转换和编辑功能
代码转换(修改代码以实现特定目标)和编辑功能也得到了极大改善。开发人员现在可以使用Gemini 2.5 Pro Preview 05-06 请求对其现有代码库进行更复杂的更改。
3. 提高函数调用的可靠性
针对上一版本用户的反馈,团队减少了函数调用中的错误,提高了调用触发率。这使得开发人员能够更可靠地生成代码。
4. 增强型代理式工作流程
增强了创建类似代理的工作流的能力,可以自主处理复杂任务。这使得开发人员更容易自动执行需要多个步骤的复杂任务。
5. 视频理解能力显著提高
Gemini 2.5 Pro Preview 具有尖端的视频理解能力,在 VideoMME 基准测试中得分高达 84.8%。将此功能与编码能力相结合,可以实现以前版本中无法实现的新工作流程。
最引人注目的新功能之一是“视频学习应用程序”。此功能在 Google AI Studio 中进行了演示,可通过单个 YouTube 视频创建交互式学习应用。理解视频内容并生成具有完整 UI 的学习应用程序的能力将成为教育内容创作者的革命性工具。
与上一版本对比(03-25)
根据WebDev Arena 排行榜,上一个版本 Gemini 2.5 Pro (03-25) 的得分为1273,而新版本的得分提高了147分。
开发人员可以通过Google AI Studio或Vertex AI的Gemini API访问 Gemini 2.5 Pro Preview。先前版本(03-25)的用户将自动路由到新版本(05-06),无需采取任何特殊操作。
除此之外,新版本的价格与之前版本相同。这对于开发人员来说是个好消息,因为这意味着尽管性能提高了,但价格却保持不变。
个人开发者可以通过Google AI Studio访问Gemini 2.5 Pro Preview。在AI Studio中,可以尝试不同的提示并通过API构建应用程序。
企业用户可以通过Vertex AI获取Gemini 2.5 Pro Preview。 Vertex AI 为大规模 API 请求和复杂工作流程提供了企业级解决方案。
对于消费者用户,可以通过Gemini应用程序访问Gemini 2.5 Pro Preview功能。 Canvas等功能尤其可以帮助您在单个提示中构建交互式 Web 应用程序。
该模型的更多功能和应用很有可能在Google I/O上推出,开发者社区对此抱有很高的期望。现有的 Gemini 2.5 Pro (03-25) 用户将自动获得新版本访问权限,无需任何额外设置,因此他们可以立即试用这些改进的功能。
随着AI技术的普及,未来的很多工作或许都将离不开AI工具,尤其对于广大开发者来说,一款好用的AI编程工具可以让项目达到事半功倍的效果。
Gemini 2.5 Pro Preview 05-06固然强大,但由于是闭源模型,高昂的收费对于AI初学者来说并不是性价比最高的选择,适用于对专业性要求较高的开发者。