ui-tars和omni-parser使用

ui-tars与omni-parser使用指南

说明

镜像中包含ui-tars、llama-factory和omni-parser。该镜像还在审批中,估计明天可以上线,到时候可以在auto-dl中的社区镜像搜索。

快速开始

使用auto-dl镜像:
在这里插入图片描述

https://www.codewithgpu.com/i/hiyouga/LLaMA-Factory/ui-tars_omni-parser_llama-factory

环境准备

将模型从系统盘移动到数据盘,移动成功后可以选择删除原文件

cp -r /root/model/UI-TARS-7B-DPO /root/autodl-tmp/
cp -r /root/omni  /root/autodl-tmp/

ui-tars web推理和训练

bash /root/LLaMA-Factory/chuli/one.sh

高级设置的提示模板要改成qwen2_vl,否则无法上传图片
在这里插入图片描述
具体的使用方法可以查看llama-factory官方
https://github.com/hiyouga/LLaMA-Factory

ui-tars api部署

进入conda环境

conda activate llama

-tp 是指需要的gpu数量,改成1

python -m vllm.entrypoints.openai.api_server --served-model-name ui-tars \
    --model /root/autodl-tmp/UI-TARS-7B-DPO --limit-mm-per-prompt image=5 --dtype=half -tp 1

使用自定义服务进行映射,方便本地电脑调用:

ssh -CNg -L 8000:127.0.0.1:8000 root@region-9.autodl.pro -p 46525

本地电脑调用示例:

curl http://localhost:8000/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "ui-tars",
        "messages": [
            {"role": "user", "content": "我想问你,5的阶
### 关于 UI-TARS-desktop 的技术资料与配置 #### 1. **UI-TARS-desktop 项目概述** UI-TARS-desktop 是基于 TARS 框架开发的一款桌面端应用工具,主要用于支持开发者更高效地管理操作 TARS 微服务框架中的各项功能[^3]。该项目通常提供图形化界面来简化复杂的微服务管理流程。 --- #### 2. **下载源码** 要获取 UI-TARS-desktop 的源码,可以通过其官方仓库地址完成克隆操作。以下是标准的 Git 克隆命令: ```bash git clone https://github.com/TarsCloud/UI-TARS.git ``` 如果需要特定分支版本,则可以指定分支名进行拉取: ```bash git clone -b <branch_name> https://github.com/TarsCloud/UI-TARS.git ``` 此过程需确保本地已安装并正确配置好 Git 工具环境[^4]。 --- #### 3. **依赖项准备** 在运行 UI-TARS-desktop 之前,必须先满足以下前置条件: - 安装 Node.js npm/yarn:用于构建前端部分。 ```bash node --version && npm --version ``` - 如果使用 Yarn 替代 NPM,请确认版本号: ```bash yarn --version ``` - 安装 Electron 或其他必要的 GUI 开发库文件,具体可查阅项目的 `package.json` 文件了解详细的依赖列表[^5]。 --- #### 4. **编译与运行** 进入项目根目录后执行如下脚本初始化依赖包以及打包应用程序: ```bash cd UI-TARS npm install || yarn install npm run build || yarn build ``` 完成后即可尝试启动程序验证是否正常工作: ```bash npm start || yarn start ``` 上述步骤会依据实际平台加载对应的窗口实例展示给用户交互界面[^6]。 --- #### 5. **配置教程** 对于初次使用者来说,可能还需要额外关注几个重要环节设置才能让整个系统流畅运作起来: - 数据连接参数调整位于 `.env` 文件内部定义的服务接口路径等信息; - 自定义样式修改可通过编辑 SCSS/CSS 资产资源实现个性化外观定制需求[^7]; 更多高级选项建议参照 README 文档说明或者社区论坛交流经验分享贴寻求帮助解答疑惑之处。 --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值