利用Canny边缘检测器进行盲文单元分割和去除多余点
1. 引言
盲文是一种主要供盲人使用的书写语言。盲文的单元模式由六个凸起的点组成,这些点精确地代表一个单元,该单元映射一个文本字符或一个单词。盲文使用的板有单面或双面压纹两种形式。为了避免这些板损坏,通常会使用OBR系统对其进行扫描、处理并转换为自然文本。
在扫描过程中,生成的图像可能会因光线不均匀、像素不规则、图像倾斜、点缺失、间距不规则或出现多余的点等原因引入噪声。
1.1 分割的目标
分割的目的是将图像划分为具有相似特征或属性的多个部分/片段,以表示有意义的单元模式。单元分割是OBR阶段的关键步骤之一。它将图像分解为一系列代表字符或单词的单元,以有意义的子图像模式呈现。具体来说,它将图像划分为许多有意义的区域,这些区域具有各自的属性,可以进行分析和提取,作为所需的目标。通常,提取的目标是一个包含六个点的单元,代表自然语言中的一个字符或单词。
1.2 分割技术
不同的单元分割技术包括:
- 阈值法
- 直方图分割法
- 基于人工神经网络(ANN)的方法
- 基于压缩和聚类的方法
- 基于边缘的方法
- 基于区域的方法
- 基于分水岭的方法
1.3 阈值分割
阈值分割利用图像的强度级别来划分图像像素,有助于区分前景对象和背景图像。阈值分割有不同的版本,如全局阈值分割、可变阈值分割和多重阈值分割。基于边缘的阈值分割有多种方法,例如:
| 边缘类型 | 强度变化特点 |
| ---- | ---- |
| 阶跃边缘 |
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



