假设有如下一张图,如何把其中的文本分块切割出来,比如“华普超市朝阳门店”、“2015-07-26”就是两个文本块。
做图像切割有很多种方法,本文描述一种最直观的投影检测法。先来看看什么是投影,简单来说,投影就是在一定方向上有效像素的数量。来看个直观的图像:
这是一张水平投影图与原图的对比,从投影图上能看到多个波峰,文字多的地方,投影就长,行间的空白处,投影为0。 上个示例代码:
public void HorizontalProjection() { //以灰度图方式读入源文件 string filename = "source.jpg"; var src = IplImage.FromFile(filename, LoadMode.GrayScale); //二值化,采用阈值分割法 Cv.Threshold(src, src, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu); //存储投影值的数组 var h = new int[src.Height]; //对每一行计算投影值 for(int y = 0;y < src.Height;++y) { //遍历这一行的每一个像素,如果是有效的,累加投影值 for(int x = 0;x < src.Width;++x) { var s = Cv.Get2D(src, y, x); if(s.Val0 == 255) h[y]++; } } //准备一个图像用于画投影图 var paintY = Cv.CreateImage(src.Size, BitDepth.U8, 1); Cv.Zero(paintY); //画图 var t = new CvScalar(255); for(int y = 0;y < src.Height;++y) { for(int x = 0;x < h[y];++x) Cv.Set2D(paintY, y, x, t); } //显示 using(var window = new CvWindow("Source")) { window.Image = src; using(var win2 = new CvWindow("Projection")) { win2.Image = paintY; Cv.WaitKey(); } } }
显然找出波峰对应的y值,就能把行切割开了。 得到一行以后,可以采用类似的思想进行垂直投影,挑了一行测试一下,效果如下:
可以看到效果