《AgentStudio 安装与配置指南》
1. 项目基础介绍
AgentStudio 是一个面向通用虚拟代理的集成环境,它为虚拟代理与任何计算机软件的交互提供了环境、工具和基准测试。该项目旨在实现健壮、通用和开放式的虚拟代理,通过提供轻量级的交互环境、创建在线基准测试任务的工具以及用于视频动作标注的工具来实现这一目标。
主要编程语言:Python
2. 项目使用的关键技术和框架
- 环境交互:支持高度通用的观察和动作空间,例如视频观察和GUI/API动作。
- 在线基准测试:提供自动评估和语言反馈的在线基准测试任务。
- 数据集构建:包括 GroundUI、IDMBench 和 CriticBench 三个数据集,用于评估虚拟代理的基本能力,如 GUI 定位、视频学习和成功检测。
3. 安装和配置准备工作及步骤
准备工作
- 确保系统中已安装 Git。
- 安装依赖的操作系统包:
如果您使用的是 Ubuntu 22.04,请执行上述命令。sudo apt-get install gnome-screenshot xclip xdotool
安装步骤
-
克隆项目仓库到本地:
git clone https://github.com/ltzheng/agent-studio.git -
创建并激活 Anaconda 环境:
conda create --name agent-studio python=3.11 -y conda activate agent-studio -
安装项目依赖:
pip install -e '.[client]' -
配置 API 密钥。将所有保密的 API 密钥存储在
agent_studio/config/api_key.json文件中,例如 OpenAI API 密钥、Claude API 密钥、Gemini API 密钥等。项目中提供了一个示例配置文件agent_studio/config/api_key_template.json。 -
(可选)根据需要,使用项目提供的工具进行基准测试任务创建、GUI元素标注和视频动作记录。
完成以上步骤后,您应该已经成功安装并配置了 AgentStudio,可以开始使用它进行虚拟代理的开发和评估了。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



