Umi-OCR 命令行使用完全指南
前言
Umi-OCR 是一款优秀的开源OCR识别工具,除了提供直观的图形界面操作外,还支持通过命令行进行高效调用。本文将全面介绍Umi-OCR的命令行功能,帮助开发者和技术爱好者更好地利用这一工具实现自动化OCR处理。
基础准备
启用HTTP服务
Umi-OCR 通过HTTP接口实现命令行与主程序的通信,因此使用前需要确保:
- 在软件主界面中开启HTTP服务
- 主机选择"仅本地"模式(默认配置)
这种设计确保了通信仅在系统内部进行,不会经过物理网卡,保障了数据安全。
命令行基础
调用入口为主程序 Umi-OCR.exe
,基本命令格式为:
umi-ocr [指令] [参数]
获取帮助信息:
umi-ocr --help
软件控制指令
Umi-OCR 提供了一系列控制软件本身的指令:
| 指令 | 功能 | 说明 | |------|------|------| | --show
| 显示主窗口 | 将软件窗口置于前台 | | --hide
| 隐藏主窗口 | 最小化软件窗口 | | --quit
| 退出软件 | 完全关闭Umi-OCR | | --reload
| 重载配置 | 重新加载配置文件(v2.1.5+) |
配置文件位于 ./UmiOCR-data/.settings
,采用INI格式。用户可以直接编辑该文件,然后通过--reload
指令使更改生效。
OCR识别指令
1. 截图识别
鼠标截图:
umi-ocr --screenshot
指定区域截图:
umi-ocr --screenshot screen=0 rect=50,100,300,200
参数说明:
screen
:显示器编号(从0开始)rect
:截图区域(x,y,w,h)
示例:
# 截取第2个显示器(50,100)-(350,300)区域
umi-ocr --screenshot screen=1 rect=50,100,300,200
2. 剪贴板识别
umi-ocr --clipboard
3. 文件路径识别
支持单个文件、多个文件或整个文件夹:
# 单个文件
umi-ocr --path "D:/test.png"
# 多个文件
umi-ocr --path "D:/img1.png" "D:/img2.png"
# 文件夹(递归识别所有图片)
umi-ocr --path "D:/images"
二维码处理指令
1. 二维码识别
umi-ocr --qrcode_read "D:/qrcode.png"
2. 二维码生成
# 基本生成
umi-ocr --qrcode_create "内容" "output.jpg"
# 指定大小(128x128)
umi-ocr --qrcode_create "内容" "output.jpg" 128
# 指定宽高(128x256)
umi-ocr --qrcode_create "内容" "output.jpg" 128 256
结果输出控制
Umi-OCR 提供多种结果输出方式:
| 指令 | 功能 | 示例 | |------|------|------| | --clip
| 复制到剪贴板 | umi-ocr --screenshot --clip
| | --output
| 输出到文件(覆盖) | umi-ocr --screenshot --output result.txt
| | --output_append
| 输出到文件(追加) | umi-ocr --screenshot --output_append log.txt
|
简写形式:
"-->"
等价于--output
"-->>"
等价于--output_append
高级开发指令
1. 页面管理
# 查询所有页面
umi-ocr --all_pages
# 添加新页面(index为模板序号)
umi-ocr --add_page [index]
# 删除页面
umi-ocr --del_page [index]
2. 模块调用
# 查询所有模块
umi-ocr --all_modules
# 调用Py模块函数
umi-ocr --call_py [模块名] --func [函数名] [参数]
# 调用QML模块函数
umi-ocr --call_qml [模块名] --func [函数名] [参数]
3. 同步调用
umi-ocr --call_qml [模块名] --func [函数名] --thread [参数]
实用案例:批量处理PDF文档
以下示例演示如何通过命令行实现PDF文档的批量OCR处理:
# 1. 添加批量文档页面
umi-ocr --add_page 3
# 2. 添加文档路径
umi-ocr --call_qml BatchDOC --func addDocs '[ \"C:/doc1.pdf\", \"C:/doc2.pdf\"]'
# 3. 开始处理
umi-ocr --call_qml BatchDOC --func docStart
注意事项
- 多图识别时需等待当前命令完成
- 路径参数中的反斜杠需改为正斜杠
- 高级指令需要一定的开发经验
- 不同系统环境下参数格式可能略有差异
通过合理利用Umi-OCR的命令行功能,开发者可以轻松实现各种OCR自动化场景,大幅提升工作效率。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考