谷歌 Gemini 3 炸场

部署运行你感兴趣的模型镜像

当地时间11月18日,谷歌发布迄今最强AI模型Gemini 3,CEO皮查伊称其“最智能”。发布即深度接入谷歌搜索的“闪电落地”速度, AI竞赛从实验室跑分转向商业化实战。其3大核心优势:

1. 博士级推理与多模态能力双冠

Gemini 3 Pro在LMArena以1501 Elo登顶,人类最后考试(HLE)裸考37.5%,GPQA Diamond测试91.9%,拓扑学难题可自动给出三种解法。多模态领域Video-MMMU测试87.6%,处理720p视频延迟不足300毫秒,能将手写食谱、论文转化为交互式材料。

2. 编程与智能体效率革新

WebDev Arena以1487 Elo夺冠,SWE-bench Verified测试76.2%,响应速度较GPT-5快40%,可生成3D游戏等复杂应用。搭配Antigravity平台,能自主完成邮件整理等任务,72小时决策一致性达95%,解决“任务漂移”问题。

3. 大语境与商业化落地能力升级

100万token上下文窗口可处理300页书籍或1小时视频,量子计算问题零样本回答质量超80%人类专家。医疗、法律等12项测试中9项领先竞品15个百分点,6.5亿月活应用及20亿用户的AI Overviews已完成更新。

安全性能同步提升,经谷歌AI史上最全面评估,防注入、抗攻击表现更优。高阶Deep Think模式HLE得分41%,GPQA Diamond达93.8%,进一步强化复杂问题解决能力。

GPT-5强化版已在测试。Gemini 3以“推理+效率+落地”优势指明方向:胜负关键在实际价值。对比竞品,其37.5%的HLE得分远超GPT-5.1的26.5%,95%的裸考准确率高于Claude 4.5的87%,仅软件工程测试略逊于Claude的77.2%。

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

11-27
Google 在 2025 年 11 月推出了第三代旗舰 AI 模型 Gemini 3.0,其预览版为 Gemini 3 Pro,被官方称为“最智能”的模型,在以下方面有显著提升: - **更先进的推理能力**:能够更精准地掌握内容的深度和细微差异,解决复杂的难题[^2]。 - **多模态理解**:具备强多模态能力,可以更好地理解和处理文本、图片、视频、音频和 PDF 等多种输入格式[^2]。 - **Agent (智能体) 和编码能力**:增强了作为智能体的能力,在编程和自动任务处理方面的性能有所跃进[^2]。 - **全新的生成式 UI 体验**:在 Google 搜索等应用中,能根据查询生成动态的视觉版面配置、互动式工具和模拟情境[^2]。 使用 Gemini 3 的步骤如下: ```bash # 登录 gemini auth # 启用 Preview Features(获取 Gemini 3 Pro) gemini settings set preview_features true # 选择 Gemini 3 Pro 模型 gemini model set gemini-3-pro-preview # 开始对话 gemini chat ``` 不同平台使用方法如下: - **网页版 (gemini.google.com)**:登录后直接在主界面输入内容,在右上角模型选择器中确认选择了 Gemini 3 或 Pro,支持多模态输入,可直接上传图片(点击相机图标)[^3]。 - **移动应用 (iOS/Android)**:下载安装最新版 Gemini App,登录后在主界面输入内容。特色功能有 Canvas(上传图片让 AI 分析或编辑)、Select and Ask(框选屏幕内容直接提问)[^3]。 - **AI Studio (开发者适用)**:访问 aistudio.google.com,登录后点击 "New Chat" 或 "Build" 创建新项目,在模型选择中选择 "gemini-3-pro-preview",支持高级功能,如长上下文 (100 万 tokens)、文件上传、代码执行[^3]。 - **Gemini CLI (命令行工具,开发者适用)**:安装使用 `npm install -g @google/gemini-cli@latest`,启动使用 `gemini` 命令进入交互界面,启用 Gemini 3 需输入 `/settings`,将 "Preview Features" 设为 true,选择模型使用 `/model gemini-3-pro-preview`,使用时直接输入问题或命令[^3]。 提示词技巧方面: - **基础原则**:精准简洁,使用准确直接的语言,避免模糊表述;结构化,建议使用 [系统指令] (角色定义、行为约束) [背景信息] (相关上下文) [具体任务] (明确要做什么) [输出格式要求] (如需要 JSON、表格等) 的格式[^3]。 - **进阶技巧**:角色设定可在提示开头指定 "以专业分析师身份回答...";图文混合时,明确说明 "以下图片展示了... 请分析...";图像推荐分辨率为 media_resolution_high(高质量);视频处理建议使用关键帧分析 (截取开始、中间、结尾画面);上下文处理先提供完整文档 / 代码,最后提出具体问题;简单任务使用 thinking_level: low 获得更快响应,复杂推理使用默认或 high 级别[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值