Umi-OCR 命令行使用完全指南

Umi-OCR 命令行使用完全指南

Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件,适用于Windows系统,支持截图OCR、批量OCR、二维码识别等功能。 Umi-OCR 项目地址: https://gitcode.com/gh_mirrors/um/Umi-OCR

前言

Umi-OCR 是一款优秀的开源OCR识别工具,除了提供直观的图形界面操作外,还支持通过命令行进行高效调用。本文将全面介绍Umi-OCR的命令行功能,帮助开发者和技术爱好者更好地利用这一工具实现自动化OCR处理。

基础准备

启用HTTP服务

Umi-OCR 通过HTTP接口实现命令行与主程序的通信,因此使用前需要确保:

  1. 在软件主界面中开启HTTP服务
  2. 主机选择"仅本地"模式(默认配置)

这种设计确保了通信仅在系统内部进行,不会经过物理网卡,保障了数据安全。

命令行基础

调用入口为主程序 Umi-OCR.exe,基本命令格式为:

umi-ocr [指令] [参数]

获取帮助信息:

umi-ocr --help

软件控制指令

Umi-OCR 提供了一系列控制软件本身的指令:

| 指令 | 功能 | 说明 | |------|------|------| | --show | 显示主窗口 | 将软件窗口置于前台 | | --hide | 隐藏主窗口 | 最小化软件窗口 | | --quit | 退出软件 | 完全关闭Umi-OCR | | --reload | 重载配置 | 重新加载配置文件(v2.1.5+) |

配置文件位于 ./UmiOCR-data/.settings,采用INI格式。用户可以直接编辑该文件,然后通过--reload指令使更改生效。

OCR识别指令

1. 截图识别

鼠标截图

umi-ocr --screenshot

指定区域截图

umi-ocr --screenshot screen=0 rect=50,100,300,200

参数说明:

  • screen:显示器编号(从0开始)
  • rect:截图区域(x,y,w,h)

示例:

# 截取第2个显示器(50,100)-(350,300)区域
umi-ocr --screenshot screen=1 rect=50,100,300,200

2. 剪贴板识别

umi-ocr --clipboard

3. 文件路径识别

支持单个文件、多个文件或整个文件夹:

# 单个文件
umi-ocr --path "D:/test.png"

# 多个文件
umi-ocr --path "D:/img1.png" "D:/img2.png"

# 文件夹(递归识别所有图片)
umi-ocr --path "D:/images"

二维码处理指令

1. 二维码识别

umi-ocr --qrcode_read "D:/qrcode.png"

2. 二维码生成

# 基本生成
umi-ocr --qrcode_create "内容" "output.jpg"

# 指定大小(128x128)
umi-ocr --qrcode_create "内容" "output.jpg" 128

# 指定宽高(128x256)
umi-ocr --qrcode_create "内容" "output.jpg" 128 256

结果输出控制

Umi-OCR 提供多种结果输出方式:

| 指令 | 功能 | 示例 | |------|------|------| | --clip | 复制到剪贴板 | umi-ocr --screenshot --clip | | --output | 输出到文件(覆盖) | umi-ocr --screenshot --output result.txt | | --output_append | 输出到文件(追加) | umi-ocr --screenshot --output_append log.txt |

简写形式:

  • "-->" 等价于 --output
  • "-->>" 等价于 --output_append

高级开发指令

1. 页面管理

# 查询所有页面
umi-ocr --all_pages

# 添加新页面(index为模板序号)
umi-ocr --add_page [index]

# 删除页面
umi-ocr --del_page [index]

2. 模块调用

# 查询所有模块
umi-ocr --all_modules

# 调用Py模块函数
umi-ocr --call_py [模块名] --func [函数名] [参数]

# 调用QML模块函数
umi-ocr --call_qml [模块名] --func [函数名] [参数]

3. 同步调用

umi-ocr --call_qml [模块名] --func [函数名] --thread [参数]

实用案例:批量处理PDF文档

以下示例演示如何通过命令行实现PDF文档的批量OCR处理:

# 1. 添加批量文档页面
umi-ocr --add_page 3

# 2. 添加文档路径
umi-ocr --call_qml BatchDOC --func addDocs '[ \"C:/doc1.pdf\", \"C:/doc2.pdf\"]'

# 3. 开始处理
umi-ocr --call_qml BatchDOC --func docStart

注意事项

  1. 多图识别时需等待当前命令完成
  2. 路径参数中的反斜杠需改为正斜杠
  3. 高级指令需要一定的开发经验
  4. 不同系统环境下参数格式可能略有差异

通过合理利用Umi-OCR的命令行功能,开发者可以轻松实现各种OCR自动化场景,大幅提升工作效率。

Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件,适用于Windows系统,支持截图OCR、批量OCR、二维码识别等功能。 Umi-OCR 项目地址: https://gitcode.com/gh_mirrors/um/Umi-OCR

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

<think>好的,我现在需要回答用户关于如何调用Umi-OCR进行识别的文档和示例代码的问题。首先,用户提到了几个引用,我需要先看一下这些引用内容,看看有没有相关的信息可以利用。 根据引用[1],里面提到OCREngine和Recognize是假设的类和方法,实际使用时需要根据库的文档调整。引用[2]介绍了Umi-OCR的功能,但没有具体调用方法。引用[3]提到需要参考主项目文档来定位配置文件或命令行配置。引用[4]给出了项目地址,可能那里有文档。 用户需要的是调用方法和示例代码,所以首先要引导他们去官方文档,因为不同的版本可能有不同的接口。根据引用[4],项目地址是gitcode上的,所以应该建议用户查看该仓库的文档部分。 另外,引用[3]提到配置文件的调整和命令行参数,可能需要说明如何通过命令行调用,或者如何查找配置文件的位置。比如,用户可能需要安装Python库后,通过导入相应的模块,并调用识别函数,但具体类名和方法名需要根据实际文档来确定。 由于用户提供的引用中没有具体的示例代码,可能需要给出一个通用的示例结构,同时提醒用户根据实际文档调整类名和方法。比如,假设的Python代码可能包括初始化OCR引擎,加载图像,调用识别方法,然后获取结果。 还要注意用户提到的引用[1]中的内容,强调需要查阅所使用的库的正确类和方法名。因此,在回答中需要多次提醒用户参考官方文档,并给出项目地址方便他们查找。 另外,用户可能需要知道如何安装Umi-OCR的库,所以可能需要提到安装步骤,比如使用pip安装,但具体包名可能因项目而异,需要根据官方指南。 总结步骤应该是:1. 访问项目文档;2. 安装必要的库或软件;3. 参考示例代码调用识别功能;4. 处理返回结果。同时,提醒用户注意版本差异和配置调整。</think>关于Umi-OCR的调用方法和识别功能,以下是基于官方资料的指引: ### 一、核心调用流程 1. **查阅官方文档** 建议优先访问[Umi-OCR_v2项目地址](https://gitcode.com/gh_mirrors/um/Umi-OCR_v2)的README和Wiki页面,其中包含API接口说明、SDK集成指南等核心信息[^4] 2. **典型调用步骤** 根据OCR技术实现原理,基础调用流程通常为: ```python # 假设的代码结构(具体类名/方法名需以文档为准) from umi_ocr import OCREngine ocr = OCREngine() result = ocr.recognize("image.jpg") # 单图识别 batch_results = ocr.batch_recognize([img1, img2]) # 批量识别 ``` 3. **配置参数调整** 通过修改`config.json`可启用图像预处理、语言模型切换等功能,配置文件路径需参照文档说明[^3] ### 二、关键功能接口 | 功能类型 | 方法示例 | 参数说明 | |----------------|-------------------------|------------------------------| | 单图识别 | `recognize(img_path)` | 支持PNG/JPG/BMP格式 | | 批量识别 | `batch_recognize(list)` | 线程数可配置 | | 区域识别 | `recognize_roi(x,y,w,h)`| 指定图像坐标区域 | | 结果导出 | `export_text()` | 支持TXT/CSV格式 | ### 三、实践建议 1. **安装注意事项** 通过`pip install umi-ocr`安装Python库后,需确保系统已安装Visual C++ Redistributable运行时组件 2. **错误排查技巧** - 图像路径含中文时建议使用`os.path.normpath()`标准化路径 - 内存不足时可启用`enable_gpu=False`降低资源消耗
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

羿辰果Gemstone

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值