基于OpenCV进行文本分块切割

最新推荐文章于 2022-06-19 17:04:49 发布

weixin_33724570

最新推荐文章于 2022-06-19 17:04:49 发布

阅读量837

点赞数

CC 4.0 BY-SA版权

文章标签：人工智能

本文链接：https://blog.youkuaiyun.com/weixin_33724570/article/details/85087679

本文介绍了如何利用OpenCV进行文本分块切割，通过投影检测法找到文本行的边界。首先，通过水平投影找到波峰确定行切割位置，然后进行垂直投影处理可能的切割错误，如汉字或数字被切分。通过图像处理优化，最终实现较好的文本块切割效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

假设有如下一张图，如何把其中的文本分块切割出来，比如“华普超市朝阳门店”、“2015-07-26”就是两个文本块。

做图像切割有很多种方法，本文描述一种最直观的投影检测法。先来看看什么是投影，简单来说，投影就是在一定方向上有效像素的数量。来看个直观的图像：

这是一张水平投影图与原图的对比，从投影图上能看到多个波峰，文字多的地方，投影就长，行间的空白处，投影为0。上个示例代码：

public void HorizontalProjection()
{
    //以灰度图方式读入源文件
    string filename = "source.jpg";
    var src = IplImage.FromFile(filename, LoadMode.GrayScale);

    //二值化，采用阈值分割法
    Cv.Threshold(src, src, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu);

    //存储投影值的数组
    var h = new int[src.Height];

    //对每一行计算投影值
    for(int y = 0;y < src.Height;++y)
    {
        //遍历这一行的每一个像素，如果是有效的，累加投影值
        for(int x = 0;x < src.Width;++x)
        {
            var s = Cv.Get2D(src, y, x);
            if(s.Val0 == 255)
                h[y]++;
        }
    }

    //准备一个图像用于画投影图
    var paintY = Cv.CreateImage(src.Size, BitDepth.U8, 1);
    Cv.Zero(paintY);

    //画图
    var t = new CvScalar(255);
    for(int y = 0;y < src.Height;++y)
    {
        for(int x = 0;x < h[y];++x)
            Cv.Set2D(paintY, y, x, t);
    }

    //显示
    using(var window = new CvWindow("Source"))
    {
        window.Image = src;
        using(var win2 = new CvWindow("Projection"))
        {
            win2.Image = paintY;
            Cv.WaitKey();
        }
    }
}

显然找出波峰对应的y值，就能把行切割开了。得到一行以后，可以采用类似的思想进行垂直投影，挑了一行测试一下，效果如下：