Halcon中使用OCR时字符的分割以及字符粘连的处理方法

  字符的分割是指在原图中将字符分割为单个的字符区域。这样,这些单个的字符才能被当作字符样本来训练分类器。因此,样本字符分割的好坏很大程度上影响mlp分类器的分类效果。
  那么,怎样才能判断自己的字符分割是好的呢?标准是:字符不要有因干扰导致的洞孔。建议的字符分割步骤如下:

1)使用小阈值来分割字符,使字符经可能的饱满。此时第一个分割出来的字符称为原始字符区域
 threshold (ImageReduced, RawSegmentation, 83, 255)
(2)使用填充算子,将整个字符区域填充,此时的字符称成胖字符
fill_up (RawSegmentation, RegionFillUp)
(3)使用开运算滤除杂波的干扰
opening_circle (RegionFillUp,RemovedNoise, 2.5)
(4)根据形状特征选取胖字符区域
select_shape(RemovedNoise : ConnectedPatterns : 'area', and, 300, 3000 : )
(5)胖字符区域与原始字符区域相交得到最后的字符区域
intersection (ConnectedPatterns, RawSegmentation, NumberCandidates)
(6)最后,调用connection算子得到每一个字符的联通区域
 connection ( NumberCandidates : ConnectedNumberCandidates : : ) 

  注意,如过字符之间存在粘连导致connection难以分割,则需要调用开运算算子来消除粘连。

该特殊矩形开运算算子的特别之处在于消除粘连区域,同时保留原始字符区域
opening_rectangle1 (Solid, Cut, 1, 7)
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值