browser-use开源程序使 AI 代理可以访问网站，自动完成特定的指定任务，告诉您的计算机该做什么，它就会完成它。

2301_78755287

于 2025-04-07 20:00:08 发布

阅读量821

点赞数 23

文章标签：人工智能 python flask

本文链接：https://blog.youkuaiyun.com/2301_78755287/article/details/147051428

版权

一、软件介绍

文末提供程序和源码下载

browser-use开源程序使 AI 代理可以访问网站，自动完成特定的指定任务，浏览器使用是将AI代理与浏览器连接的最简单方法。告诉您的计算机该做什么，它就会完成它。

二、快速开始

使用 pip （Python>=3.11）：

pip install browser-use
Install Playwright: 安装 Playwright：

playwright install chromium
Spin up your agent: 启动您的代理：

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()

async def main():
agent = Agent(
task="Compare the price of gpt-4o and DeepSeek-V3",
llm=ChatOpenAI(model="gpt-4o"),
)
await agent.run()

asyncio.run(main())
Add your API keys for the provider you want to use to your .env file.
将要使用的提供程序的 API 密钥添加到 .env 文件中。

OPENAI_API_KEY=
ANTHROPIC_API_KEY=
AZURE_ENDPOINT=
AZURE_OPENAI_API_KEY=
GEMINI_API_KEY=
DEEPSEEK_API_KEY=

使用 UI 进行测试

简单地运行 gradio 示例：

uv pip install gradio
python examples/ui/gradio_demo.py

三、演示

任务：将杂货添加到购物车，然后结帐。

提示：将我最新的 LinkedIn 关注者添加到 Salesforce 中的潜在客户中。

提示：阅读我的简历并找到 ML 工作，将它们保存到一个文件中，然后在新的标签页中开始申请它们，如果你需要帮助，就问我。

提示：在 Google Docs 中写一封信给我爸爸，感谢他所做的一切，并将文档保存为 PDF

提示：在 Hugging face 上查找具有 cc-by-sa-4.0 许可证的模型，并按点赞数排序，将前 5 名保存到文件中

四、其他

Agent 代理
Improve agent memory (summarize, compress, RAG, etc.)
改进代理内存（summarize、compress、RAG 等）
Enhance planning capabilities (load website specific context)
增强规划功能（加载网站特定上下文）
Reduce token consumption (system prompt, DOM state)
减少 Token 消耗（系统提示符、DOM 状态）
DOM Extraction DOM 提取
Improve extraction for datepickers, dropdowns, special elements
改进日期选择器、下拉列表、特殊元素的提取
Improve state representation for UI elements
改进 UI 元素的状态表示
Rerunning tasks 重新运行任务
LLM as fallback LLM作为 fallback
Make it easy to define workflow templates where LLM fills in the details
轻松定义工作流模板，其中LLM填写详细信息
Return playwright script from the agent
从代理处返回 playwauthor 脚本
Datasets 数据
Create datasets for complex tasks
为复杂任务创建数据集
Benchmark various models against each other
将各种模型相互进行基准测试
Fine-tuning models for specific tasks
针对特定任务微调模型
User Experience 用户体验
Human-in-the-loop execution
人机交互执行
Improve the generated GIF quality
提高生成的 GIF 质量
Create various demos for tutorial execution, job application, QA testing, social media, etc.
为教程执行、工作申请、QA 测试、社交媒体等创建各种演示。