第二讲
上一部分(OCR初步letters_mlp例程分析)讲了创建分类器进行OCR识别并生成自己的训练文件,这一部分我们着重分析利用模板进行OCR识别。主要分析两个例程bottle、bottlet。
bottle例程
主要是分割并读取酒瓶上的数字
第一步:具体化酒瓶上需要识别的数字字体,一般采用提前训练好的'Universal_0-9_NoRej'
FontName := 'Universal_0-9_NoRej'
第二步:识别
首先读取图片并显示,在之前的学习笔记中都详细阐述过,这里不多加赘述。得到酒瓶图像显示结果
然后创建文本模板create_text_model_reader
,输入是上一步确定的字体FontName
,输出是文本模板句柄TextModel
;
接下来设置模板参数set_text_model_param
,GenParamName
的允许参数值列表不同,具体取决于使用create_text_model_reader
创建文本模型时设置的模式。这里设置字符尺寸的min_stroke_width
(像素中字符的最小笔划宽度)为6
,线性结构text_line_structure
主要是为了简化对分段文本内特定结构(例如日期或序列号)的搜索从而定义行结构,对于每个文本行,计算字符之间的距离,并且基于这些距离,文本行被分成文本块。在此过程中忽略诸如“。”,“_”和“ - ”之类的短字符并将其视为空格。例如,如果要查找的文本是包含月,日和年两个字符的日期,则结构将为“2 2 2”。如果年份可能包含两个或四个字符,则结构将为“2 2 2-4”,表示最后一个字符块由2到4个字符组成。由于这里日期的格式已知,所以此处定义为2 2 2
。
之后读取酒瓶上的日期find_text
。实现对输入图片Image
根据刚刚创建的文本模板TextModel
查找,返回值为TextResultID
句柄;
最后获取文本内容get_text_object<