【免费下载】 Umi-OCR 命令行使用完全指南-优快云博客

Umi-OCR 命令行使用完全指南

【免费下载链接】Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件，适用于Windows系统，支持截图OCR、批量OCR、二维码识别等功能。项目地址: https://gitcode.com/GitHub_Trending/um/Umi-OCR

前言

Umi-OCR 是一款优秀的开源OCR识别工具，除了提供直观的图形界面操作外，还支持通过命令行进行高效调用。本文将全面介绍Umi-OCR的命令行功能，帮助开发者和技术爱好者更好地利用这一工具实现自动化OCR处理。

基础准备

启用HTTP服务

Umi-OCR 通过HTTP接口实现命令行与主程序的通信，因此使用前需要确保：

在软件主界面中开启HTTP服务
主机选择"仅本地"模式（默认配置）

这种设计确保了通信仅在系统内部进行，不会经过物理网卡，保障了数据安全。

命令行基础

调用入口为主程序 Umi-OCR.exe，基本命令格式为：

umi-ocr [指令] [参数]

获取帮助信息：

umi-ocr --help

软件控制指令

Umi-OCR 提供了一系列控制软件本身的指令：

指令	功能	说明
`--show`	显示主窗口	将软件窗口置于前台
`--hide`	隐藏主窗口	最小化软件窗口
`--quit`	退出软件	完全关闭Umi-OCR
`--reload`	重载配置	重新加载配置文件（v2.1.5+）

配置文件位于 ./UmiOCR-data/.settings，采用INI格式。用户可以直接编辑该文件，然后通过--reload指令使更改生效。

OCR识别指令

1. 截图识别

鼠标截图：

umi-ocr --screenshot

指定区域截图：

umi-ocr --screenshot screen=0 rect=50,100,300,200

参数说明：

screen：显示器编号（从0开始）
rect：截图区域（x,y,w,h）

示例：

# 截取第2个显示器(50,100)-(350,300)区域
umi-ocr --screenshot screen=1 rect=50,100,300,200

2. 剪贴板识别

umi-ocr --clipboard

3. 文件路径识别

支持单个文件、多个文件或整个文件夹：

# 单个文件
umi-ocr --path "D:/test.png"

# 多个文件
umi-ocr --path "D:/img1.png" "D:/img2.png"

# 文件夹（递归识别所有图片）
umi-ocr --path "D:/images"

二维码处理指令

1. 二维码识别

umi-ocr --qrcode_read "D:/qrcode.png"

2. 二维码生成

# 基本生成
umi-ocr --qrcode_create "内容" "output.jpg"

# 指定大小（128x128）
umi-ocr --qrcode_create "内容" "output.jpg" 128

# 指定宽高（128x256）
umi-ocr --qrcode_create "内容" "output.jpg" 128 256

结果输出控制

Umi-OCR 提供多种结果输出方式：

指令	功能	示例
`--clip`	复制到剪贴板	`umi-ocr --screenshot --clip`
`--output`	输出到文件（覆盖）	`umi-ocr --screenshot --output result.txt`
`--output_append`	输出到文件（追加）	`umi-ocr --screenshot --output_append log.txt`

简写形式：

"-->" 等价于 --output
"-->>" 等价于 --output_append

高级开发指令

1. 页面管理

# 查询所有页面
umi-ocr --all_pages

# 添加新页面（index为模板序号）
umi-ocr --add_page [index]

# 删除页面
umi-ocr --del_page [index]

2. 模块调用

# 查询所有模块
umi-ocr --all_modules

# 调用Py模块函数
umi-ocr --call_py [模块名] --func [函数名] [参数]

# 调用QML模块函数
umi-ocr --call_qml [模块名] --func [函数名] [参数]

3. 同步调用

umi-ocr --call_qml [模块名] --func [函数名] --thread [参数]

实用案例：批量处理PDF文档

以下示例演示如何通过命令行实现PDF文档的批量OCR处理：

# 1. 添加批量文档页面
umi-ocr --add_page 3

# 2. 添加文档路径
umi-ocr --call_qml BatchDOC --func addDocs '[ \"C:/doc1.pdf\", \"C:/doc2.pdf\"]'

# 3. 开始处理
umi-ocr --call_qml BatchDOC --func docStart

注意事项

多图识别时需等待当前命令完成
路径参数中的反斜杠需改为正斜杠
高级指令需要一定的开发经验
不同系统环境下参数格式可能略有差异

通过合理利用Umi-OCR的命令行功能，开发者可以轻松实现各种OCR自动化场景，大幅提升工作效率。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考