浏览器使用：AI控制浏览器的开源项目安装与配置指南

葛依励Kenway

于 2025-03-26 15:10:18 发布

阅读量783

点赞数 12

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gitblog_01035/article/details/146531000

浏览器使用：AI控制浏览器的开源项目安装与配置指南

browser-use 它可以让AI像人类一样浏览网页、点击按钮、填写表单、甚至处理复杂的任务，比如自动填写简历、或者从网页中提取信息。源项目地址：https://github.com/browser-use/browser-use 项目地址: https://gitcode.com/gh_mirrors/br/browser-use

1. 项目基础介绍

本项目名为“浏览器使用”（browser-use），是一个开源项目，旨在让AI代理能够控制浏览器，从而实现自动化操作。通过该项目，开发者可以构建AI驱动的自动化任务，例如自动化数据抓取、测试、交互等。该项目主要使用Python编程语言。

2. 项目使用的关键技术和框架

Python：作为主要的编程语言，Python以其简洁易读的语法和强大的库支持，成为开发者的首选。
Playwright：这是一个自动化浏览器的Node.js库，本项目使用Python绑定来实现浏览器自动化。
LangChain：一个基于语言的智能链框架，用于构建复杂的AI任务。

3. 项目安装和配置的准备工作与详细步骤

准备工作

确保你的系统中已经安装了Python（版本至少为3.11）。
安装pip，Python的包管理器。
准备好一个文本编辑器或IDE来编写代码。

安装步骤

安装项目依赖

首先，需要安装项目的依赖项。打开终端或命令提示符，运行以下命令：
```
pip install browser-use
```
安装Playwright浏览器自动化工具

接下来，安装Playwright，它将用于控制浏览器：
```
playwright install chromium
```
设置环境变量

在项目目录中创建一个.env文件，并添加你的API密钥。例如，如果你使用OpenAI API，它可能看起来像这样：
```
OPENAI_API_KEY=your_openai_api_key
```

编写代码

使用文本编辑器或IDE创建一个新的Python文件。以下是一个简单的例子，展示如何创建一个AI代理并运行任务：

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv

load_dotenv()

async def main():
    agent = Agent(
        task="示例任务",
        llm=ChatOpenAI(model="gpt-4o")
    )
    await agent.run()

asyncio.run(main())

运行项目

保存你的Python文件，然后在终端或命令提示符中运行它：
```
python your_script.py
```

按照以上步骤，你就可以成功安装和配置“浏览器使用”项目，开始创建你的AI自动化任务了。

browser-use 它可以让AI像人类一样浏览网页、点击按钮、填写表单、甚至处理复杂的任务，比如自动填写简历、或者从网页中提取信息。源项目地址：https://github.com/browser-use/browser-use 项目地址: https://gitcode.com/gh_mirrors/br/browser-use

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

葛依励Kenway 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。