基于混合纹理特征的文档图像语言分类
在文档图像分析领域,脚本/语言识别一直是一个重要的子领域。以往大多数文本识别方案基于行级或词级,而块级或文档级的文本识别工作相对较少。块级无分割脚本识别可提高分类速度,有助于根据脚本检索文档。不同语言的脚本在视觉上具有独特特征,本文将利用这些特征进行基于语言的文档图像分类,并提出了一种结合平稳小波变换(SWT)和方向梯度直方图(HOG)的混合特征提取方案,以提高分类性能。
相关工作回顾
在文档图像分析领域,众多研究者开展了丰富多样的工作,为脚本/语言识别技术的发展奠定了坚实基础。以下是一些具有代表性的研究成果:
- 印度语言脚本识别 :Chaudhury等人运用基于Gabor滤波器从连通组件提取的特征,并结合组合分类器,构建了印度语言脚本识别系统,有效提升了识别性能。Kulkarni等人采用基于视觉线索的特征,借助概率神经网络(PNN)实现了多语言文档的脚本识别。
- 多语言脚本行识别 :Pal和Chaudhury开发了一套系统,能够从文档中识别英语、孟加拉语、阿拉伯语、中文和天城文的脚本行。他们巧妙地结合了基于形状、统计以及部分基于水库的特征,为多语言脚本行的准确识别提供了有效方法。
- 手写文本识别 :Rajput等人利用离散余弦变换(DCT)和小波特征,提出了手写文本识别系统。他们以块为单位处理文档,并运用K近邻方法进行分类,为手写文本的识别提供了新的思路。
- 文本特征提取与识别 :Pardeshi等人采用多分辨率空间特征进行印度脚本识别,通过对文档图像的分割单词应用
超级会员免费看
订阅专栏 解锁全文
1076

被折叠的 条评论
为什么被折叠?



