Halcon学习笔记(八)——OCR识别初步 利用文本模板识别与生成训练文件

Halcon OCR识别:模板例程分析与训练文件生成
这篇博客介绍了Halcon中OCR识别的两种方法:bottle例程和bottlet例程。bottle例程通过创建文本模板识别酒瓶上的数字,涉及图像预处理、创建模板、设置参数、查找文本和显示结果。bottlet例程则讲解如何生成OMC训练文件,包括字符独立连通域的获取、训练文件创建和基于MLP的OCR分类器训练。
第二讲

上一部分(OCR初步letters_mlp例程分析)讲了创建分类器进行OCR识别并生成自己的训练文件,这一部分我们着重分析利用模板进行OCR识别。主要分析两个例程bottle、bottlet。

bottle例程

主要是分割并读取酒瓶上的数字

第一步:具体化酒瓶上需要识别的数字字体,一般采用提前训练好的'Universal_0-9_NoRej'

FontName := 'Universal_0-9_NoRej'

第二步:识别
首先读取图片并显示,在之前的学习笔记中都详细阐述过,这里不多加赘述。得到酒瓶图像显示结果
在这里插入图片描述

然后创建文本模板create_text_model_reader,输入是上一步确定的字体FontName,输出是文本模板句柄TextModel

接下来设置模板参数set_text_model_paramGenParamName的允许参数值列表不同,具体取决于使用create_text_model_reader创建文本模型时设置的模式。这里设置字符尺寸的min_stroke_width(像素中字符的最小笔划宽度)为6,线性结构text_line_structure主要是为了简化对分段文本内特定结构(例如日期或序列号)的搜索从而定义行结构,对于每个文本行,计算字符之间的距离,并且基于这些距离,文本行被分成文本块。在此过程中忽略诸如“。”,“_”和“ - ”之类的短字符并将其视为空格。例如,如果要查找的文本是包含月,日和年两个字符的日期,则结构将为“2 2 2”。如果年份可能包含两个或四个字符,则结构将为“2 2 2-4”,表示最后一个字符块由2到4个字符组成。由于这里日期的格式已知,所以此处定义为2 2 2

之后读取酒瓶上的日期find_text。实现对输入图片Image根据刚刚创建的文本模板TextModel查找,返回值为TextResultID句柄;

最后获取文本内容get_text_object<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ThetaQing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值