告别OpenAI Operator!Nanobrowser:免费开源的浏览器AI自动化解决方案
还在为OpenAI Operator每月200美元的订阅费发愁?寻找一款真正免费、开源且功能强大的浏览器AI自动化工具?Nanobrowser作为一款Chrome扩展,提供了高端网页自动化能力,同时让你完全掌控数据和隐私。本文将详细介绍这款开源多智能体浏览器自动化工具如何帮助你实现高效的网页自动化任务。
为什么选择Nanobrowser?
Nanobrowser作为一款Chrome扩展,相比OpenAI Operator具有多项显著优势:
- 100%免费 - 无订阅费用或隐藏成本。只需安装并使用你自己的API密钥,按实际使用量付费。
- 隐私优先 - 所有操作都在本地浏览器中运行。你的凭据完全由你掌控,绝不会与任何云服务共享。
- 灵活的LLM选项 - 连接到你偏好的LLM提供商,可以为不同的智能体选择不同的模型。
- 完全开源 - 浏览器自动化过程完全透明。没有黑箱或隐藏流程。
注意:我们目前支持OpenAI、Anthropic、Gemini、Ollama、Groq、Cerebras、Llama和自定义OpenAI兼容提供商,未来将支持更多提供商。
核心功能
Nanobrowser提供了一系列强大功能,使其成为网页自动化的理想选择:
多智能体系统
Nanobrowser的核心是其多智能体系统,位于chrome-extension/src/background/agent/目录下。这个系统由多个专门的AI智能体协作完成复杂的网页工作流:
- Navigator(导航器) - 处理DOM交互和网页导航
- Planner(规划器) - 高级任务规划和策略制定
- Validator(验证器) - 验证任务完成情况和结果
这些智能体的实现可以在chrome-extension/src/background/agent/agents/目录中找到,包括base.ts基础类和各智能体的具体实现。
交互式侧边面板
Nanobrowser提供了直观的聊天界面,位于pages/side-panel/目录。这个侧边面板具有实时状态更新功能,让用户可以轻松与AI智能体交互,监控任务进度。
主要组件包括:
- ChatInput.tsx - 聊天输入组件
- MessageList.tsx - 消息列表展示
- ChatHistoryList.tsx - 聊天历史记录
任务自动化与历史记录
Nanobrowser能够无缝自动化跨网站的重复性网页任务,并提供完整的对话历史记录功能。任务管理逻辑主要在chrome-extension/src/background/task/manager.ts中实现,而历史记录功能则由chrome-extension/src/background/agent/history.ts处理。
存储系统位于packages/storage/目录,提供了Chrome扩展存储的抽象,确保数据安全和高效访问。
快速开始
安装方式
Nanobrowser提供两种安装方式:
从Chrome网上应用店安装(稳定版):
- 访问Nanobrowser Chrome Web Store页面
- 点击"添加到Chrome"按钮
- 出现提示时确认安装
重要提示:如需最新功能,请按照下面的"手动安装最新版本"进行安装,因为Chrome网上应用店版本可能因审核流程而延迟更新。
手动安装最新版本:
-
下载
- 从官方GitCode仓库下载最新的
nanobrowser.zip文件:https://gitcode.com/GitHub_Trending/na/nanobrowser/releases
- 从官方GitCode仓库下载最新的
-
安装:
- 解压
nanobrowser.zip。 - 在Chrome中打开
chrome://extensions/ - 启用右上角的"开发者模式"
- 点击左上角的"加载已解压的扩展程序"
- 选择解压后的
nanobrowser文件夹。
- 解压
-
配置智能体模型
- 点击工具栏中的Nanobrowser图标打开侧边栏
- 点击右上角的"设置"图标
- 添加你的LLM API密钥
- 选择不同智能体使用的模型(Navigator, Planner)
从源代码构建
如果你更喜欢自己构建Nanobrowser,可以按照以下步骤操作:
-
** prerequisites **:
-
克隆仓库:
git clone https://gitcode.com/GitHub_Trending/na/nanobrowser.git cd nanobrowser -
安装依赖:
pnpm install -
构建扩展:
pnpm build -
加载扩展:
- 构建后的扩展将位于
dist目录中 - 按照手动安装部分的步骤将扩展加载到浏览器中
- 构建后的扩展将位于
-
开发模式(可选):
pnpm dev
更多构建和开发细节可以在CONTRIBUTING.md中找到。
选择你的模型
Nanobrowser允许你为每个智能体配置不同的LLM模型,以平衡性能和成本。以下是推荐的配置:
更好的性能
- Planner:Claude Sonnet 4
- 更好的推理和规划能力
- Navigator:Claude Haiku 3.5
- 高效的网页导航任务处理
- 性能和成本的良好平衡
经济高效的配置
- Planner:Claude Haiku或GPT-4o
- 合理的性能,成本更低
- 复杂任务可能需要更多迭代
- Navigator:Gemini 2.5 Flash或GPT-4o-mini
- 轻量级且经济高效
- 适合基本导航任务
本地模型
-
设置选项:
- 使用Ollama或其他自定义OpenAI兼容提供商在本地运行模型
- 零API成本,完全隐私保护,数据不会离开你的机器
-
推荐模型:
- Qwen3-30B-A3B-Instruct-2507
- Falcon3 10B
- Qwen 2.5 Coder 14B
- Mistral Small 24B
模型配置界面可以在pages/options/src/components/ModelSettings.tsx中找到实现。
实际应用示例
Nanobrowser可以通过简单的一句话完成各种强大的任务:
新闻摘要
"前往TechCrunch并提取过去24小时的十大头条新闻"
GitHub研究
"在GitHub上查找拥有最多星标的热门Python仓库"
购物研究
"在亚马逊上找到一款防水设计、价格低于50美元、电池续航至少10小时的便携式蓝牙音箱"
这些任务展示了Nanobrowser如何理解复杂查询并自动执行多步骤网页操作,省去了人工浏览和搜索的麻烦。
技术架构
Nanobrowser采用现代化的技术架构,确保高性能和可维护性:
项目结构
这是一个使用Turbo进行构建编排和pnpm workspaces的monorepo项目。
核心扩展:
chrome-extension/- 主要Chrome扩展清单和后台脚本src/background/- 带有多智能体系统的后台服务工作器src/background/agent/- AI智能体实现(Navigator, Planner, Validator)src/background/browser/- 浏览器自动化和DOM操作
UI页面 (pages/):
side-panel/- 主聊天界面(React + TypeScript + Tailwind)options/- 扩展设置页面(React + TypeScript)content/- 页面注入的内容脚本
共享包 (packages/):
shared/- 通用工具和类型定义storage/- Chrome扩展存储抽象ui/- 共享React组件schema-utils/- 验证模式i18n/- 国际化支持
更多架构细节可以在AGENTS.md中找到。
关键技术
Nanobrowser使用了一系列前沿技术:
- Chrome Extension Manifest V3 - 最新的扩展标准
- React 18 与 TypeScript - 类型安全的UI开发
- Tailwind CSS - 高效的样式开发
- Vite - 快速的构建工具
- Chrome APIs - 浏览器自动化
- LangChain.js - LLM集成
构建系统使用Turbo管理任务依赖和缓存,确保高效的开发和构建流程。
社区与贡献
Nanobrowser是一个开源项目,欢迎社区贡献和参与:
如何贡献
我们需要你的帮助来让Nanobrowser变得更好! 欢迎各种形式的贡献:
-
分享提示和用例
- 加入我们的Discord服务器
- 分享你如何使用Nanobrowser。帮助我们构建有用的提示和实际用例库。
-
提供反馈
- 试用Nanobrowser并在Discord服务器中提供性能反馈或改进建议。
-
贡献代码
- 查看CONTRIBUTING.md了解代码贡献指南
- 提交错误修复、功能或文档改进的拉取请求
我们相信开源和社区协作的力量。加入我们一起构建网页自动化的未来!
安全报告
如果你发现安全漏洞,请不要通过issues、pull requests或讨论公开披露。
相反,请创建GitHub Security Advisory以负责任地报告漏洞。这使我们能够在公开披露之前解决问题。
感谢你帮助保护Nanobrowser及其用户的安全!
结论
Nanobrowser作为一款免费开源的浏览器AI自动化解决方案,为用户提供了一个强大的替代方案,彻底告别昂贵的OpenAI Operator。其多智能体系统、灵活的LLM支持、本地运行能力和用户友好的界面使其成为各种网页自动化任务的理想选择。
无论你是开发人员、研究人员还是普通用户,Nanobrowser都能帮助你更高效地完成网页相关任务,节省时间和精力。立即尝试Nanobrowser,体验下一代浏览器AI自动化工具!
如果你喜欢Nanobrowser,请给我们一个星标🌟并加入我们的Discord社区!
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考




