数字文档图像文本区域检测与断层图像分割阈值选择方法解析
在数字图像处理领域,文本区域检测和断层图像分割是两个重要的研究方向。本文将详细介绍数字文档图像中文本区域检测的方法,以及一种基于投影数据的断层图像分割最优阈值选择方法。
数字文档图像文本区域检测
在数字文档图像中准确检测文本区域是许多应用的基础,如文档数字化、光学字符识别等。以下是一种有效的文本区域检测方法:
1. 预处理与Gabor滤波
- 对文档图像进行预处理,得到预处理后的输出图像。
- 对预处理后的图像应用Gabor滤波器,并对输出图像进行归一化。从归一化后的图像可以明显看出,字符对Gabor滤波器有强烈响应,趋近于白色。
2. 能量图评估
- Otsu自适应阈值分割 :应用Gabor滤波器后的输出图像灰度值在0 - 255之间,文本区域比非文本区域亮。使用Otsu自适应阈值方法进行文本和非文本区域的分割,输出图像中黑色像素表示背景,白色像素表示可能的文本区域,此图像为文档图像的预能量图。
- 连通分量分析 :对预能量图进行连通分量分析,消除高频非文本对象,如线条、框架和噪声。计算所有连通分量的宽度平均值(wa)和高度平均值(ha),并构建简单的决策树来更精确地分割可能的文本区域。决策树规则如下:
- 若CCwd ≤ 3像素且CChg ≤ 3像素,则该连通分量被视为噪声。
- 若CCwd ≤ 10 * wa且CChg ≤ ha,则该连通分量被视为水平线。
- 若CCwd ≤ wa且CChg ≥ 10
超级会员免费看
订阅专栏 解锁全文
8

被折叠的 条评论
为什么被折叠?



