Deepseek-V3 计算机使用:这是一个完全免费的 AI 代理,一句话操控浏览器(Browser Use)

Deepseek V3模型推出后,社区里有许多基于这个模型做的实践。

以前有一个浏览器使用代理:Browser Use,可以控制电脑做很多事情。而最近看到一个GitHub仓库 — browser-use-webui,是Browser Use分支而来。

它扩展了大语言模型(LLM)的支持,兼容Gemini、OpenAI、Azure、Anthropic、Deepseek和Ollama 等模型。还提供了一个浏览器使用的Web界面,配置起来非常简单,可以在几秒钟内控制整个Web浏览器代理。

首先,克隆这个仓库到你的电脑上。

git clone git@github.com:warmshao/browser-use-webui.git

然后,打开cursor,打开命令面板,选择python解释器,然后点击第二步,创建虚拟环境:

安装好依赖

如果是windows。那么可以选择git bash为默认终端,

然后你每次新建终端都会默认使用这个python虚拟环境,同时git bash也方便cursor agent执行命令。

安装依赖之后还需要安装这两个(Browser Use Python包、Playwright浏览器和相关组件)。

完成上面步骤,环境就配置好了。

然后把环境变量配置一下,

  • • 将 .env.example 复制为 .env,并设置你的环境变量,包括 LLM 的 API 密钥:deepseek和google模型API。

  • • 如果使用你自己的浏览器:

  • • 设置 CHROME_PATH 为浏览器的可执行文件路径(例如,Windows 上为 C:\Program Files\Google\Chrome\Application\chrome.exe)。

  • • 设置 CHROME_USER_DATA 为浏览器的用户数据目录(例如,C:\Users\<YourUsername>\AppData\Local\Google\Chrome\User Data)。

启动它:

python webui.py --ip 127.0.0.1 --port 7788

注意关闭所有chorme,在其他的浏览器打开这个链接:http://127.0.0.1:7788。

打开浏览器,你将看到这些选项,你可以选择想要使用的代理类型,比如原始代理或者自定义代理。原始代理不使用任何系统提示,而自定义代理则会使用一些优化过的系统提示和功能。

你还可以设置最大运行步骤,这决定了代理执行任务时最多可以进行多少步,默认是100步。

还有“使用Vision”选项,可以通过允许代理查看截图来提高性能,虽然这个选项在Deepseek中不可用,但在Gemini中可以使用。你还可以选择LLM提供商,如Deepseek或Gemini,并在这里输入模型名称。

对于Gemini,它默认是2.0 Flash,而对于Deepseek,你需要改成“deepseek chat”。你还可以修改LLM的Base URL和API密钥,如果不想在环境文件中设置的话。

接下来是浏览器设置,你可以选择使用你自己的浏览器,运行时是否启用无头模式,或者是否禁用安全性,还可以设置窗口的高度和宽度。

另外,代理还支持录制浏览器会话,并保存为屏幕录像,你可以稍后查看录像,并且可以更改录制路径。

在主任务选项中,你可以输入代理需要完成的任务,并附上额外的信息。这些信息会和提示一起传给代理。

让它告诉我们Nvidia的股票价格,发送后,你可以看到它开始工作,打开Google并搜索相关信息。

稍等片刻,它完成了任务,这真的很棒。

浏览器代理与各种模型兼容性非常好,因为它并不依赖于模型的视觉能力。这款Web UI非常出色,整体表现很酷。


如何系统学习掌握AI大模型?

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

在这里插入图片描述

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

在这里插入图片描述

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方优快云官方认证二维码,免费领取【保证100%免费

在这里插入图片描述

### 如何选择合适的 DeepSeek-V3 版本 对于希望利用深度求索提供的高性能语言模型来满足特定需求的用户而言,了解两种主要版本——DeepSeek-V3DeepSeek-V3-Base 的区别至关重要。 #### 功能对比 - **DeepSeek-V3** - 此款模型经过优化适用于广泛的用途,在数学推理、长文本处理以及中文任务方面展现出卓越性能[^1]。因此,当面临涉及复杂逻辑运算或是需要理解并生成高质量自然语言内容的任务时,该选项尤为合适。 - **DeepSeek-V3-Base** - 集中于提升编程相关的能力,这使得它成为软件开发者和其他技术专业人士的理想工具。如果目标是在编写代码辅助、API 文档解析或其他计算机科学领域内寻求帮助,则此版本会提供更好的支持和服务质量。 #### 适用场景分析 - 对于那些从事教育行业、科研工作或者任何其他可能涉及到大量文字材料整理与创作的人士来说,选用具备更强综合能力的 DeepSeek-V3 将有助于提高工作效率和产出水平。 -Base 显然是更为明智的选择。 通过上述描述可以看出,具体应该挑选哪版取决于个人的实际应用场景及其所追求的核心价值所在。 ```python # 示例:假设有一个函数用于推荐最适合用户的DeepSeek V3版本 def recommend_deepseek_version(task_type): if task_type == "general": return "建议使用DeepSeek-V3" elif task_type == "programming": return "建议使用DeepSeek-V3-Base" print(recommend_deepseek_version("general")) # 输出: 建议使用DeepSeek-V3 print(recommend_deepseek_version("programming")) # 输出: 建议使用DeepSeek-V3-Base ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值