【免费下载】 Umi-OCR 命令行使用完全指南

Umi-OCR 命令行使用完全指南

【免费下载链接】Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件,适用于Windows系统,支持截图OCR、批量OCR、二维码识别等功能。 【免费下载链接】Umi-OCR 项目地址: https://gitcode.com/GitHub_Trending/um/Umi-OCR

前言

Umi-OCR 是一款优秀的开源OCR识别工具,除了提供直观的图形界面操作外,还支持通过命令行进行高效调用。本文将全面介绍Umi-OCR的命令行功能,帮助开发者和技术爱好者更好地利用这一工具实现自动化OCR处理。

基础准备

启用HTTP服务

Umi-OCR 通过HTTP接口实现命令行与主程序的通信,因此使用前需要确保:

  1. 在软件主界面中开启HTTP服务
  2. 主机选择"仅本地"模式(默认配置)

这种设计确保了通信仅在系统内部进行,不会经过物理网卡,保障了数据安全。

命令行基础

调用入口为主程序 Umi-OCR.exe,基本命令格式为:

umi-ocr [指令] [参数]

获取帮助信息:

umi-ocr --help

软件控制指令

Umi-OCR 提供了一系列控制软件本身的指令:

指令功能说明
--show显示主窗口将软件窗口置于前台
--hide隐藏主窗口最小化软件窗口
--quit退出软件完全关闭Umi-OCR
--reload重载配置重新加载配置文件(v2.1.5+)

配置文件位于 ./UmiOCR-data/.settings,采用INI格式。用户可以直接编辑该文件,然后通过--reload指令使更改生效。

OCR识别指令

1. 截图识别

鼠标截图

umi-ocr --screenshot

指定区域截图

umi-ocr --screenshot screen=0 rect=50,100,300,200

参数说明:

  • screen:显示器编号(从0开始)
  • rect:截图区域(x,y,w,h)

示例:

# 截取第2个显示器(50,100)-(350,300)区域
umi-ocr --screenshot screen=1 rect=50,100,300,200

2. 剪贴板识别

umi-ocr --clipboard

3. 文件路径识别

支持单个文件、多个文件或整个文件夹:

# 单个文件
umi-ocr --path "D:/test.png"

# 多个文件
umi-ocr --path "D:/img1.png" "D:/img2.png"

# 文件夹(递归识别所有图片)
umi-ocr --path "D:/images"

二维码处理指令

1. 二维码识别

umi-ocr --qrcode_read "D:/qrcode.png"

2. 二维码生成

# 基本生成
umi-ocr --qrcode_create "内容" "output.jpg"

# 指定大小(128x128)
umi-ocr --qrcode_create "内容" "output.jpg" 128

# 指定宽高(128x256)
umi-ocr --qrcode_create "内容" "output.jpg" 128 256

结果输出控制

Umi-OCR 提供多种结果输出方式:

指令功能示例
--clip复制到剪贴板umi-ocr --screenshot --clip
--output输出到文件(覆盖)umi-ocr --screenshot --output result.txt
--output_append输出到文件(追加)umi-ocr --screenshot --output_append log.txt

简写形式:

  • "-->" 等价于 --output
  • "-->>" 等价于 --output_append

高级开发指令

1. 页面管理

# 查询所有页面
umi-ocr --all_pages

# 添加新页面(index为模板序号)
umi-ocr --add_page [index]

# 删除页面
umi-ocr --del_page [index]

2. 模块调用

# 查询所有模块
umi-ocr --all_modules

# 调用Py模块函数
umi-ocr --call_py [模块名] --func [函数名] [参数]

# 调用QML模块函数
umi-ocr --call_qml [模块名] --func [函数名] [参数]

3. 同步调用

umi-ocr --call_qml [模块名] --func [函数名] --thread [参数]

实用案例:批量处理PDF文档

以下示例演示如何通过命令行实现PDF文档的批量OCR处理:

# 1. 添加批量文档页面
umi-ocr --add_page 3

# 2. 添加文档路径
umi-ocr --call_qml BatchDOC --func addDocs '[ \"C:/doc1.pdf\", \"C:/doc2.pdf\"]'

# 3. 开始处理
umi-ocr --call_qml BatchDOC --func docStart

注意事项

  1. 多图识别时需等待当前命令完成
  2. 路径参数中的反斜杠需改为正斜杠
  3. 高级指令需要一定的开发经验
  4. 不同系统环境下参数格式可能略有差异

通过合理利用Umi-OCR的命令行功能,开发者可以轻松实现各种OCR自动化场景,大幅提升工作效率。

【免费下载链接】Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件,适用于Windows系统,支持截图OCR、批量OCR、二维码识别等功能。 【免费下载链接】Umi-OCR 项目地址: https://gitcode.com/GitHub_Trending/um/Umi-OCR

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值