OmniParser v2本地部署（1）部署OmniParser_v2模型

青石横刀策马

已于 2025-03-06 21:07:49 修改

阅读量1.8k

点赞数 7

分类专栏：从头学机器学习文章标签： python

于 2025-02-27 10:28:58 首次发布

本文链接：https://blog.youkuaiyun.com/m0_53115174/article/details/145896636

版权

从头学机器学习专栏收录该内容

43 篇文章

订阅专栏

前不久，微软开源了最新的OmniParser v2版本

在这里插入图片描述
在新的基础测试基准 Screen Spot Pro 上，使用 OmniParser v2 实现了 39.5% 的最新业界领先结果。

关于omniparser的技术解析可以参考这篇博客屏幕解析工具——OmniParser，这里主要介绍OmniParser v2本地部署

1 创建新的conda环境并激活

conda create -n omni python=3.12
conda activate omni

2 git导入项目、下载依赖

git clone https://github.com/microsoft/OmniParser

会生成一个文件夹
在这里插入图片描述
里面有个requirements.txt，是我们所需要的依赖，进入该目录中，直接pip安装依赖

cd ./OmniParser
pip install -r requirements.txt

等待依赖安装

3 下载模型权重

   # download the model checkpoints to local directory OmniParser/weights/
   for f in icon_detect/{train_args.yaml,model.pt,model.yaml} icon_caption/{config.json,generation_config.json,model.safetensors}; do huggingface-cli download microsoft/OmniParser-v2.0 "$f" --local-dir weights; done
   mv weights/icon_caption weights/icon_caption_florence