每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
谷歌 DeepMind 又双叒出大招,正式发布旗下最聪明的 AI 模型——Gemini 2.5,直接把“AI 思考力”拉升到新维度。这不是简单的升级,而是一次“进化”,让模型不仅会答题,更懂得思考、推理和编程。
这次亮相的主角是 Gemini 2.5 Pro Experimental,直接空降 LMArena 榜首,成为有史以来最受人类偏爱的模型。在数学、科学、推理和代码任务中表现炸裂,甚至在堪称“AI 期末大考”的 Humanity’s Last Exam 拿下了领先分数(18.8%,无工具辅助),一举把 OpenAI 和 Claude 都甩在后面。
什么是“思考型”模型?
不是简单的你问我答,而是能在答之前“深呼吸一下”。它能分析上下文、提炼信息、做逻辑推演,然后再作答,就像一个真正的专家。这种推理能力,早在 Gemini 2.0 的 Flash Thinking 就有初步探索,而 2.5 则将这项技能全面整合进模型本体,意味着以后每个 Gemini 模型都会自带“大脑”。
Gemini 2.5 Pro 有多强?
- 推理力爆表:在 GPQA、AIME 2025 等高阶测试中稳坐第一;
- 代码生成逆天:不光会写网页和 App,甚至可以从一句 prompt 直接生成可运行的小游戏;
- 代码能力验证:在 SWE-Bench Verified 基准上用自定义代理跑出 63.8% 的高分,业界翘楚。
上下文窗口?大的离谱。
Gemini 2.5 Pro 支持高达 100 万 token 的上下文,等于大约 70 万词,甚至有传言马上会扩展到 200 万 token。这意味着它可以一次性“吞下”一本技术手册、一段视频字幕、整个项目代码库,还能正确理解并回答问题。
如何体验?
开发者可以现在就去 Google AI Studio 上手试试,也可以通过 Gemini 应用的“高级用户”选项切换使用 2.5 Pro 模型。企业用户也即将能在 Vertex AI 上解锁更多能力。
总的来说,Gemini 2.5 不只是新一代模型,而是 Google 在 AI 推理力和多模态能力上放出的一记重拳,标志着智能代理、复杂问题解决能力和多模态理解即将迈入全新时代。AI 的“动脑筋”时代,正式到来。