孟加拉语手写文档倾斜检测与校正及不完整数据天际线查询算法研究
孟加拉语手写文档倾斜检测与校正
在处理文档图像时,倾斜检测与校正是一个重要的环节,特别是对于孟加拉语手写文档。由于手写风格的多样性和复杂性,传统的倾斜检测与校正方法可能无法达到理想的效果。
现有方法概述
在过去的研究中,已经提出了多种倾斜检测与校正方法。例如,有的方法使用KNN聚类技术来找出倾斜角度;有的考虑文档图像中的表格、图形、文本行等特征,提出了新颖的倾斜角度检测方法;还有线性回归直线技术,根据计算出的角度旋转图像;Hough变换方法也被用于检测倾斜角度,通过先检测文本行,再进行倾斜校正。此外,Ahmed等人提出了迭代旋转和对齐技术来校正孟加拉语手写文档的倾斜,该方法在文档具有不同倾斜角度时能产生有效的结果。
提出的改进算法
本文提出的算法主要包括以下几个阶段:
1. 预处理 :
- 数字相机或其他扫描仪通常以RGB格式获取输入图像,由于输入图像有多个颜色分量,需要将其转换为灰度图像和二值图像。
- 去除尺寸小于5的较小噪声和一些符号(逗号、点、分号、连字符等)。
- 应用中值滤波器去除图像中的不必要噪声。
2. 应用形态学算子 :
- 为了得到所需的连通分量,对二值化图像应用形态学闭合操作,以去除图像中的不连续性。
- 对于输入图像$X_{ij}$,应用大小为$3×3$的方形结构元素。
- 闭合操作通过输入图像和结构元素的膨胀,然后再用相同的结构元素进行腐蚀来完成,公式为$R_c = (X_{ij} ⊕ SE)
超级会员免费看
订阅专栏 解锁全文
3070

被折叠的 条评论
为什么被折叠?



