在许多文本图像的预处理过程中, 二值化过程是至为关键的一个环节。二值化算法的效果会对后续的处理如版面分析,字符定位以及识别等产生决定性的影响。
二值化的算法有很多,大体分为两类: 全局阈值算法(如otsu算法)和局部阈值算法(如niblack)。而在汗牛充栋的局部阈值算法中,niblack 是实现方法较为简单,算法效果较为稳定的一种。但传统的niblack算法需要对图像中的每个像素计算其邻域的统计性质(均值与方差),算法复杂度为o(size *area) ,其中size 为图像像素尺寸大小,area 为邻域面积。作者尝试地对计算均值和方差的方法进行了改进,使得总体算法复杂度降低为 o(size),从而做到与邻域窗口大小基本无关。
算法的关键是对每个像素的局部窗口求和过程的计算方式。图像实际上可看作是个二维数组,对二维数组中每个元素求局部窗口和的常规方式(C#代码)如下:

文章介绍了二值化算法中的Niblack算法,通过改进计算方式,将传统算法复杂度从o(size*area)降低到o(size),实现了与邻域窗口大小基本无关的快速求和过程,适用于文本图像预处理。
最低0.47元/天 解锁文章
9864

被折叠的 条评论
为什么被折叠?



