
在 AI Agent(智能体)概念爆发的当下,行业内一直存在一个痛点:大模型“脑子”很强,但“手脚”很笨。它们能写出完美的后端代码,却无法登录阿里云控制台帮你开通一个数据库;它们能通过 API 抓取数据,却难以像人类一样在复杂的网页 UI 中点击、拖拽和验证。
Anthropic 最新发布的 Claude 浏览器扩展(Claude Chrome Extension) 配合 Claude Opus 4.5 模型,正在试图打破这一僵局。这不仅仅是一个简单的网页摘要工具,当它与 Claude Code 终端工具结合时,展示了一种令人战栗的未来:AI 开始具备了“全浏览器控制权”,能够实现从代码编写、基础设施配置到端到端测试的全自动闭环。
本文将深入拆解这一新工具的核心能力,并分析其对开发者工作流的深远影响。
浏览器里的“幽灵”:不仅是阅读,更是操作
许多浏览器插件仅仅停留在“阅读”层面,即提取网页文本进行摘要。但 Claude 的新扩展展示了真正的 Agentic(代理)能力。
屏幕感知与自主导航
Claude 并非简单地抓取 HTML 代码,而是通过截图和视觉识别来理解页面。在演示中,当接到“总结 Twitter 上关于 OpenAI 最新模型新闻”的任务时,它展示了类似人类的操作逻辑:自主导航到 Twitter,搜索关键词,浏览并截图,最后生成报告,。
更激进的是其 “High Risk Mode(高风险模式)”。一旦开启,Claude 将不再每一步都询问许可,而是像一位被充分授权的员工,独立执行多步操作。这种模式虽然激进,但对于高频重复性任务而言,是通向真正自动化的必经之路。

最低0.47元/天 解锁文章
1272

被折叠的 条评论
为什么被折叠?



